УДК 004.896
ЯЗЫКИ ОПИСАНИЯ ОНТОЛОГИЙ ДЛЯ ТЕХНИЧЕСКИХ ПРЕДМЕТНЫХ ОБЛАСТЕЙ
© 2014 Е. Е. Буракова, Н. М. Боргест, М. Д. Коровин
Самарский государственный аэрокосмический университет имени академика С. П. Королёва (национальный исследовательский университет)
Основной задачей языков описания онтологий является описание семантики данных предметной области. В настоящее время наиболее распространённой формой представления семантически связанных данных является онтология, состоящая из набора концептов предметной области и связей между ними. В настоящей статье рассмотрены проблемы существующих инструментариев для создания хранилищ семантически связанных технических данных и предлагаемые пути их решения с помощью онтологий. Описан современный подход к классификации средств и подходов онтологического инжиниринга. Выделены сильные и слабые стороны описанных подходов. Приведён краткий обзор языков описания онтологий и примеры их применения в аэрокосмической отрасли. Рассмотрены проблемы применения формализованных языков при описании технических предметных областей. Выделены XML и HTML как наиболее широко распространенные языки описания предметных областей в современных информационных системах. Подробно описан OWL как наиболее перспективный язык описания онтологий, рекомендованный консорциумом W3C. Описаны разновидности языка OWL и их применимость к решению различных задач описания технических предметных областей с учётом ограничений описательной способности и сложности синтаксиса каждой версии. Приведены примеры использования языка OWL в технических предметных областях.
Онтология, Semantic web, формальные языки, жизненный цикл, инженерия, предметная область, базы данных, языки описания онтологий.
Введение
Для формализации и структурирования информации с целью её последующего использования в рамках единого информационного пространства предметной области (ПрО) необходимо создание единых баз данных (БД), что осложняется гетерогенностью источников и хранилищ данных, наличием неструктурированной информации, содержанием в хранилищах данных противоречивой либо дублирующей информации, необходимостью обеспечения совместного использования данных несколькими пользователями. Проблема создания единых БД может быть решена при помощи онтологического подхода.
Онтологический инжиниринг является подобластью инженерных знаний, изучающей методы и методологии построения онтологий, процесс разработки и жизненный цикл (ЖЦ) онтологий [1], комплекты инструментов и языки, которые поддерживают эти методы. Язык опи-
сания онтологии - это формальный язык, предназначенный для создания информационных моделей в рамках некоторой ПрО.
В разнообразии средств и подходов к созданию информационных систем выделяются три основные концепции создания языков описания онтологий: формализованные технические языки на базе естественных, машинно-ориентированные языки, универсальные языки.
Формализованные технические языки
Глобализация современных промышленных комплексов, характерная для производства высокотехнологичной продукции, зачастую приводит к возникновению коммуникативных проблем у персонала, говорящего на разных языках. В настоящее время английский язык претендует на роль универсального средства деловой коммуникации, однако он обладает рядом недостатков, присущих есте-
ственным языкам. Наиболее серьёзным его недостатком является возможность неоднозначной трактовки текста, что недопустимо в сфере профессиональной коммуникации. В настоящий момент существует несколько успешных проектов создания формализованных языков на базе естественных. Для всех этих языков характерен набор правил формализации, используемых для обеспечения полноты и однозначности семантики текста. Для большинства формализованных технических языков характерен следующий набор правил [2-5]:
■ использование слова только в одном заранее оговоренном значении;
■ использование исключительно простых предложений;
■ запрет на постановку подлежащего в конец предложения;
■ запрет на изменение инвертированного порядка частей составного сказуемого;
■ запрет постановки прямого дополнения перед сказуемым;
■ запрет на использование причастных оборотов в качестве синтаксических оборотов.
Формализация языка значительно облегчает автоматическую обработку текста. В качестве примера рассмотрим регламентированные языки, созданные под эгидой ассоциации AECMA (Европейская ассоциация аэрокосмической промышленности), а также язык Gellish [2, 3]:
STE (Simplified Technical English) [4] - это формализованные спецификации написания текстов для повышения их семантической прозрачности. В STE ограничивается набор используемых времён, форм глаголов, определён разрешённый и запрещённый список слов для использования. Спецификация в первую очередь предназначена для написания инструкций. ASD (AeroSpace and Defence Industries Association of Europe) STE100 (ранее известный как AECMA Simplified English) был создан как регламентированный язык при участии AECMA и AIA (Американская ассоциация аэрокосмической промыш-
ленности) для написания эксплуатационной документации в аэрокосмической и оборонной промышленности. ASD STE100 имеет строгую грамматику и синтаксические правила, а также ограниченный лексический состав. Сегодня этому стандарту следуют члены AECMA и AIA, среди которых такие компании, как British Aerospace, Airbus, The Boeing Company, Lockheed Martin, Rolls Royce, Dassault и Saab Aerosystems и другие [5]. Ниже приведены примеры сравнения текстов с одинаковым семантическим смыслом, написанных на естественном языке и с использованием стандарта STE.
STE: ««Stop the power supply» (Остановите источник питания).
Non-STE: ««Turn off the power» (Выключите энергию).
Объяснение: «Turn» используется также для обозначения действия, выражающего поворот чего-то вокруг своей оси. Если не требуется повернуться вокруг своей оси для отключения питания, то не используется слово «Turn».
STE: «Set the rotary switch to INPUT» (Установите поворотный переключатель в ВВОД).
Non-STE: «Rotary switch to INPUT» (Поворотный переключатель в ВВОД).
Объяснение: нельзя пропускать глаголы (для сокращения длины предложения), читатель не будет знать, что происходит действие над выключателем.
STE: «Make sure that the oxygen tubes are fully clean. This will help to prevent contamination and explosion» (убедитесь в том, что кислородные трубки полностью чисты. Это может помочь предотвратить загрязнение и взрыв).
Non-STE: «Extreme cleanliness of oxygen tubes is imperative» (экстремально необходима чистота кислородных труб).
Объяснение: необходима конкретная информация о предупреждении или предостережении. Важно донести до пользователя точную и чёткую информацию о том, что может случиться, чтобы привлечь немедленно его внимание.
STR (Simplified Technical Russian) -упрощённый технический русский язык. При экспорте российской аэрокосмической промышленности необходима документация на английском языке, что создало проблему с переводом документов. После успешной реализации STE в российской компании BETA AIR в партнёрстве с компанией Tedopres был разработан язык STR, который широко используется в аэрокосмической отрасли в России [6].
Gellish - язык для полной и однозначной спецификации бизнес- и физических процессов, продуктов и услуг; для представления информации о приобретении, изготовлении, монтаже, эксплуатации и хранении продукции; для обмена информацией между компьютерными системами. Gellish используется при разработке информационных систем на всех этапах ЖЦ.
Машинно-ориентированные языки
Для решения проблемы создания машиночитаемых баз знаний необходимы специализированные языки описания се-
мантики. Работы в этом направлении ведутся с начала 70-х годов [7]. Инструментами первых попыток создания онтологий были специализированные машинные языки онтологического описания. По типу применяемой логики их классифицируют на языки: фреймово-продукционные, дис-криптивной логики и логики первого порядка [8].
Широко распространёнными представителями машинных языков являются KIF (Knowledge Interchange Format) [9] и CycL (Cycorp Language) [10].
KIF - универсальный машинно-ориентированный язык для обмена данными в рамках выбранной ПрО. KIF имеет декларативную семантику и логическую всесторонность (т.е. предусматривает выражение произвольных предложений в исчислении предикатов первого порядка). Язык обеспечивает представление знаний, используется для описания объектов, функций и отношений. KIF - это язык продукционного типа, где каждая продукция записывается в виде импликации, например:
(subclass ServiceModel ContentBearingObject)
(documentation ServiceModel "The service model tells how the service works; ")
(=>
(instance ?Model ServiceModel) (exists (?Service)
(implements AModel ?Model ?Service)))
(=>
(and
(instance ?Model ServiceModel) (implements AModel ?Model ?Service) (instance ?Using ?UsingAService) (patient ?Using ?Service)) (represents ?Model ?Using))
Первые две строки определяют класс ServiceModeL Первая продукция указывает, что каждой модели соответствует некоторый сервис. Вторая продукция говорит о том, что модель описывает взаимодействие пользователя с сервисом [11].
СуеЬ - формальный язык, синтаксис которого базируется на логике первого
порядка. Объекты, составляющие словарь CycL, объединяются в выражения, которые используются для создания утверждений в Cyc БД. Исходный код CycL находится в свободном доступе по лицензии OpenCyc. Однако для работы большинства приложений Cycl необходимо дополнительно лицензировать сервер Apache.
Общим недостатком этой группы языков является сложность их синтаксиса и необходимость в специальных инструментах для интерпретации. Этого недостатка лишены универсальные языки, которые, сохраняя описательную полноту для компьютерных систем, обеспечивают семантическую прозрачность для человека.
Универсальные языки
XML (Extensible Markup Language) [12] - рекомендованный W3C (World Wide Web Consortium - консорциум Всемирной паутины) язык разметки данных. Спецификация XML описывает XML-документы и частично описывает поведение XML-процессоров (программ, читающих XML-документы и обеспечивающих доступ к их содержимому). XML разрабатывался как язык создания машиночитаемых документов с простым формальным синтаксисом, обладающим семантической прозрачностью для комфортного восприятия человеком. Основ-
ной сферой применения языка XML является Интернет.
HTML (HyperText Markup Language) [13] - стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц содержат описание разметки на языке HTML. Язык HTML интерпретируется браузерами и отображается в виде документа в удобной для человека форме. Язык XHTML (Extensible Hypertext Markup Language) [14] является более строгим вариантом HTML, он следует всем ограничениям XML, и фактически XHTML можно воспринимать как приложение языка XML к области разметки гипертекста.
В качестве примера рассматривается ПрО-справочник по моделям самолётов, который представлен набором HTML-страниц (по одной на каждую модель). В примере выделяются пассажирские и транспортные самолёты. Объединение этих сведений показано ниже на странице aircrafts.html [15]:
Страница aircrafts.html_
<SCRIPT language = ONTODEF>
CATEGORY Firm
{
SCALAR name;
SCALAR country;
}
CONCEPT Ilushin IMPLEMENTS Firm; SET Ilushin .name = 'Il'; SET Ilushin .country = 'Russia'; CONCEPT Tupolev IMPLEMENTS Firm; SET Tupolev .name = 'Tu'; SET Tupolev.country = 'Russia';
CATEGORY Plane
{
SCALAR name DEF 'Plane'; // Название самолёта LIST modifications DEF []; // Список возможных модификаций SCALAR type; // Тип самолёта (сверхзвуковой/дозвуковой)
SCALAR speed; //Скорость самолёта }
IF Plane.speed<=1250 THEN Plane.type - subsonic'; IF Plane.speed>1250 THEN Plane.type - supersonic'; SET Plane.type = 'speed is unknown';
CATEGORY PassengerPlane EXTENDS Plane_
{
SCALAR passengers; // Число пассажиров
}
CATEGORY TransportPlane EXTENDS Plane
{
SCALAR mass; // Масса полезной нагрузки }
</SCRIPT>
На странице aircrafts.html указаны: наименование, страна производитель, список возможных модификаций, тип самолёта, скорость самолёта, число пассажиров, масса полезной нагрузки. Любая
Страница tu154.html
Таким образом, создаётся возможность для организации предметной онтологии, состоящей из некоторого числа HTML-страниц. Например, страница самолёта Ту-154 находится по названию самолёта:
SEARCH
USE ' aircrafts.html' AS aircrafts WHERE (@aircrafts~Plane.name == 'Tu-154') AND (IMPLE-
MENTS(PassengerPlane))
Или зная, например, что искомый самолёт дозвуковой и берёт на борт до 150 человек:
SEARCH
USE ' aircrafts.html' AS aircraft WHERE (@aircraft~Plane.type = = 'subsonic')
AND(@aircraft~PassengerPlane.passengers = = 150)
Пример поиска демонстрирует элемент «интеллектуальности» проводимого
страница, содержащая информацию о конкретном самолёте, может быть дополнена онтологическим описанием, например, следующим образом:
поиска - информация о том, что самолёт Ту-154 дозвуковой, явно нигде не указывалась, а была выведена логически по правилу, общему для всех концептов, прямо или косвенно представляющих категорию Plane [15].
RDF (Resource Description Framework) [16] - это разработанная W3C модель представления данных для машинной обработки. RDF является частью концепции семантической паутины (SemanticWeb). RDFS (RDF Schema) [17] -расширение RDF, которое используется для определения таксономий классов, свойств и других данных. RDF и RDFS позволяют работать с метаданными.
UML (Unified Modeling Language) [18] - язык графического описания для объектного моделирования в области разработки программного обеспечения. UML является языком широкого профиля, использующим графические обозначения для создания абстрактной модели информационной системы, называемой UML-моделью. UML был создан для описания,
<USE 'aircrafts.html' AS aircraft >
<CONCEPT tu154 IMPLEMENTS @ aircraft ~PassengerPlane> <ASSIGN tu154.name> Tu-154 </ASSIGN> <SET tu154. firm = @Tupolev> <SET tu154.speed = 900>
<SET tu154.modifications = $['Tu-154A', 'Tu-154M']> <SET tu154.passengers = 150>_
визуализации, проектирования и документирования программных систем.
SysML (Systems Modeling Language) [19] - предметно-ориентированный язык моделирования систем. Поддерживает определение, анализ, проектирование, проверку и подтверждение соответствия широкого спектра систем. SysML был разработан в рамках проекта специфика-
ции с открытым исходным кодом и имеет открытую лицензию для распространения и использования. Как язык, SysML является расширением языка ЦМЕ. На рис. 1 как пример использования языка SysML показан блок avMotion многократно используемой динамической модели движения самолёта [19].
par [Package] System_ConteKt [AV Motion] J
«block»
Operator
«Attribute»
flightCommands:cmd
«block«
PhysicalEnvironment
«Attribute»
wind:wind
«block»
AirVehicle
«Attributs«
rateOfMotion:Rate
1 с С oristra i nip ro p e rty»
avMotion
□ fltCmds Constraints
motion = function (fltCmds, wind)
wind
□ motion
Рис. 1. Блок ауМойои динамической модели движения самолёта на языке SysML [19]
Свойство ограничения для модели движение самолёта состоит из трёх блоков: Оператор, ФизическаяСреда, Лета-тельныйАппарат. Внутри каждого блока имеется Атрибут со своими значениями. Линии, соединяющие параметры и атрибуты, являются обязательными операциями для выполнения полёта. Внутри avMo-tion параметры fltCmds, wind и motion являются переменными в логических выражениях. Функция
rateOfMotion flightCommands)
function (wind,
задаёт название function для математической функции, для которой скорость движения является функцией wind (ветра) и flightCommands (команда полёта). Параметры не вносят новые значения в пространство состояний, они являются механизмом для ограничений между атрибутами.
SPARQL (SPARQL Protocol and RDF Query Language) [20] используется для представления запросов к разнообразным источникам данных, независимо от того, хранятся эти данные непосредственно в RDF либо представляются в виде RDF с помощью промежуточного программного обеспечения. SPARQL рекомендован консорциумом W3C в качестве одной из технологий семантической паутины. Результаты запросов SPARQL могут быть представлены в виде RDF-графов.
OWL (Web Ontology Language) [21] - язык для записи семантики ПрО в онтологиях, созданный в рамках проекта SemanticWeb. Язык OWL позволяет описывать классы, присущие веб-документам и приложениям, и отношения между ними. OWL рекомендован W3C и имеет 3 диалекта (подмножества терминов):
• OWL Lite - имеет наименьшую выразительную мощность, достаточную для решения простых задач.
• OWL DL - обладает выразительной мощью, эквивалентной дескриптивной логике (разрешимой части логики предикатов первого порядка). Выразительности этого диалекта достаточно для решения большинства задач, встречающихся при проектировании онтологий. OWL DL имеет два важных свойства: полнота (все заключения являются вычислимыми) и разрешимость (все вычисления завершаются в конечное время). В OWL DL классу запрещено быть экземпляром.
• OWL Full - наиболее выразительный диалект, эквивалентен RDF, но не га-
рантирует, что логический вывод в такой онтологии будет вычислимым. В частности, в Full-диалекте классы могут одновременно выступать в роли класса и экземпляра [22].
С помощью OWL между объектами можно устанавливать иерархические отношения типа «общее-частное». Для этого используется конструкция rdfs:subClassOf. Например [23], определение класса «самолёт» и указание на то, что самолёт является частным случаем летательного аппарата, выглядит следующим образом:
<owl:Class rdf:ID="самолёт ">
<rdfs:subClassOf rdf:resource="#летательный аппарат "/>. </owl:Class>
Онтологии могут быть использованы для создания универсальной информационной модели, которая позволяет изучать информационное пространство с точки зрения элементов, ассоциаций между элементами, свойства предметов и ссылки на документацию, которая описывает и определяет их. Онтология и таксономия зависят от физических элементов, которые они представляют, и могут быть разработаны совместно.
В документации по OWL приведён пример увязки разнородных информационных моделей в рамках универсальной модели для аэрокосмической отрасли, где
основные пользователи: инженер технического обслуживания, который ищет информацию, относящуюся к определенной части (например, лонжерон крыла), и инженер-конструктор, который решает задачу повторного использования конкретного сборочного узла.
Поддержка универсальной модели содержит определения ограничений для всех её представлений. Эти ограничения могут быть использованы для улучшения поиска или проверки их согласованности. Ниже представлен пример ограничений в синтаксисе языка OWL [24]:
biplane(X) => CardinalityOf(wing(X)) = 2
wingspar(X) AND wing(Y) AND isComponentOf(X,Y) => length(X) < length(Y)
В первой строке ограничивается количество крыльев у самолёта схемы «биплан», во второй строке указано, что лонжерон крыла является частью крыла, поэтому размах лонжерона должен быть меньше размаха крыла.
В разработанной NASA информационной базе OWL, описывающей проект полёта Phoenix на Марс с помощью языка запросов SPARQL, можно решать поисковые задачи вида [25]:
Простой запрос: найти URI (Uniform Resource Identifier — унифицированный идентификатор ресурса) и вывести имя для компонента "Spacecraft System". SPARQL Запрос: select distinct ?cid ?cn where { ?c rdf:type mission:Component. ?c base:identifier ?cid. ?c base:canonicalName ?cn filter (?cn = "Spacecraft System")} Результат:
■
C.2 Spacecraft System (C.2 - идентификатор, Spacecraft System - имя компонента)
■ Сложный запрос: найти и вывести идентификаторы и имена для всех функций, выполняемых компонентом, имя которого "Spacecraft System"
SPARQL Запрос:
select distinct ?fid ?fn where { ?c rdf:type mission:Component. ?c base:canonicalName ?cn. ?c mission:performs ?f. ?f base:identifier ?fid. ?f base:canonicalName ?fn. filter (?cn = "SpacecraftSystem")} Результат:
F.1.1.2.1 Transport Payload to Martian Vicinity (транспортная грузоподъёмность вблизи Марса) F.1.2.2.3 Execute Commands (выполнение команд)
F.1.2.2.3 Maintain Communication (поддержание связи)
F.1.1.2 Transport Payload to Martian Surface (транспортная грузоподъёмность на поверхности Марса) F.1.2.2 Maintain Operational State (поддержание рабочего состояния)
В одной из последних инициатив INCOSE (международная организация, объединяющая системных инженеров и занимающаяся развитием системной инженерии) - «Systems Engineering Vision
2020» декларируются принципы моделе-ориентированного подхода к системному инжинирингу (СИ), который получил название MBSE (Model-based Systems Engineering) [26]. MBSE - это формальное применение моделирования для поддержки системных требований, разработки, анализа, верификации и валидации систем в фазе концептуального проектирования и последующих фазах ЖЦ системы. Разработку принципов СИ и MBSE для космических систем (КС) осуществляют организации NASA, ECSS, INCOSE, OMG и др. Стандарты, спецификации и рекомендации этих организаций являются источником информации для формирования понятий онтологии СИ КС. В настоящее время работы по инженерии знаний и онтологии в области КС проводятся NASA в рамках проекта NExIOM (NASA Exploration Information Ontology Model) [27]. В качестве инструмента для создания онтологии СИ КС предполагается использовать программную среду проектирования онтологий Protégé [28], которая включает редактор онтологий, позволяющий проектировать онтологию, разворачивая таксономическую структуру классов и слотов. Ниже приведены фрагменты сгенерированных в Protégé OWL-описаний концептов, определений классов и аксиом онтологии СИ КС. Классы «SYSTEMS -ENGINEERING» и «REQUIREMENT -ENGINEERING» определяются следующим образом:
<owl:Class rdf:ID= "Systems_engineering"/> <owl:Class rdf:ID= "Requirement_engineering"/>
Определение общего класса онтологии «SYSTEMS лежность его классу «THING» выражается так:
ENGINEERING» и принад-
<rdfs:domain> <owl:Class>
<owl:unionOf rdf:parseType= "Collection">
<rdf:Description rdf:about= "http://www.w3.org/2002/07/owl#Thing"/>
<owl:Class rdf:about= "#Systems_engineering"/>
</owl:unionOf>
</owl:Class>
</rdfs:domain>
Аксиомы и онтологии СИ КС записываются в виде:
<owl:Class rdf:about= "#Functional_requirement"> <rdfs:subClassOf rdf:resource= "#Requirement_engineering"/> </owl:Class>
<owl:Class rdf:about= "#Requirement_engineering"> <rdfs:subClassOf rdf:resource= "#Systems_engineering"/>
</owl:Class>
OWL-онтологию (документ, описанный на языке OWL) СИ КС при необходимости можно преобразовать в XML-документ и использовать его для обмена в распределённой компьютерной системе поддержки СИ. OWL-документ также можно конвертировать в XML-формат для обмена моделями и далее в модель на языке SysML (UML). Следовательно, в зависимости от целей конкретных процессов СИ и на различных этапах ЖЦ системы можно использовать языки OWL и SysML (рис. 2).
В Национальном авиационном университете Украины рассмотрели задачу применения онтологии при описании информационно-программного обеспечения для поддержки и эксплуатации авиационной техники. На основе вербального описания набора взаимосвязанных терминов: аэропорт, авиационная деятельность, объекты авиационной деятельности, безопасность авиации, аэронавигационное оборудование - было сформировано графическое представление (рис. 3) и аналитическое описание [29].
Рис. 2. Взаимосвязь между O WL- и SysML-моделями [26]
Системы онтологии «авиационной деятельности» могут быть представлены в языках XML, RDF.
<rdf:Description>
<rdf:type rdf:resource="&owl;AllDisjointClasses"/> <owl:members rdf:parseType="Collection"> <rdf:Description
rdf:about="&0ntology1086052309921;Аэронавигационное обслуживание"/> <rdf:Description rdf:about= "&0ntology1086052309921;Аэропорт "/> <rdf:Description
rdf:about= "&0ntology1086052309921;Безопасность_авиации "/> <rdf:Description
rdf:about="&Ontology1086052309921;Объекты_авиационной_деятельности"/> <rdf:Description
rdf:about="&0ntology1086052309921;Субъект_авиационной_деятельности"/> </owl:members> </rdf:Description>
</rdf:RDF>
В Самарском государственном аэрокосмическом университете на кафедре конструкции и проектирования летательных аппаратов разрабатывается пилотный проект робота-проектанта самолёта. Тезаурус проектанта, созданный на языке OWL, служит семантической основой при
согласовании разнородных информационных моделей в среде предварительного проектирования самолёта. Фрагмент структуры тезауруса, разрабатываемого в онторедакторе Protégé, на примере геометрии крыла самолёта представлен на рис. 4 [30].
▼ ( ! еометрические_параметры_крыла_в_плане
Поперечный_угол_крыла = Угол_поперечного_7_крыла
Стр е л о в и д н о сть п о_з а д н е й кр о м ке г 1 Стр е л о в и д н о сть п о_ п и н и и м а кс и м а л ь н ы х то п щ и н i Стреловидность_по_линии_четвертей_хорд Стреловидность_по_передней_кромке
\ 1 Отрицательное_сужение_крыла
Угол_поперечного_7_крыла = Поперечный_угол_крыла
Изменяемый_угол_стреловидности
[■1 Нулевой_угол_стреловидности i Переменный_угол_стреловидности
Крыло_сверхбольшого_удл мнения
[......«f Параболическое_крь1ло_с_прямой_задней_кромкой
[ ' Корневая_хорда = Осевая_хорда
'Средняя_аэродинамическая_хорда_(САХ)'
▼ ( Геометрическиепараметрыпрофилякрыла
Относительная_кривизна_профиля_крыла Отн о с ите л ь н а я _то л щ и н а_п р о ф и л я_к р ы л а
Рис. 4. Описание геометрических параметров крыла самолёта в Protégé [30]
Заключение
В рамках онтологического подхода решаются задачи создания единых баз данных сложных предметных областей в условиях гетерогенных информационных полей. Язык описания онтологий в значительной степени влияет на характеристики создаваемой информационной систе-
мы. С учётом требований к расширяемости и поддерживаемости, предъявляемых к базам данных технической информации, предпочтительными являются языки, синтаксис которых близок к естественному языку при сохранении выразительных возможностей формальной логики, такие как OWL или XML.
Библиографический список
1. Ontology Summit 2013 Communique. Towards Ontology Evaluation across the Life Cycle. Available at: http://ontolog.cim3.net/cgi-bin/wiki.pl?OntologySummit2013 Communi que.
2. Conservative groupoids recognize only regular languages. Available at: http://www.academia.edu/9200925/Conserva tive_groupoids_recognize_only_regular_lang uages_Extended_Version_.
3. Gellish A. Product Modeling Language. Available at
http://sourceforge.net/apps/trac/gellish/#a5.1 TheGellishlanguage.
4. Orlando Chiarello, Dr. Knezevic Jezdimir The Role of Simplified Technical // English in Aviation Maintenance. 2013. No. 2. P. 36-38.
5. ASD Simplified Technical English Specification ASD-STE100. Available at: http://www.asd-ste100.org.
6. Simplified English. Available at: http://www.aecma.ru/.
7. Semantic Information Modeling in Formal English. Available at: http://www.gellish.net/.
8. Oscar Corcho A Roadmap to Ontology Specification Languages. Available at: http://www.cs.man.ac.uk/~ocorcho/document s/ekaw00_CorchoGomezPerez.pdf.
9. Казекин М.М. История языков представления онтологий. http://www.ict.edu.ru/ft/006054/2008_4_03-11.pdf.
10. Knowledge Interchange Format. Available at: http://www.ksl .stanford.edu/knowl edge-sharing/kif/.
11. CycL Syntax. Available at: http://www.cyc.com/cyc/cycl/syntax.
12. Негода Д. Языки представления онтологий.
http://callisto.nsu.ru/documentation/CSIR/qm eta/rus_237.pdf.
13. Share: News and Opinions about HTML. Available at: http://www.w3. org/html/.
14. Steven Pemberton. XHTML 1.0 The Extensible HyperText Markup Language. Available at: http://www.w3.org/TR/xhtml1/.
15. Soshnikov D. Software Toolkit for Building Embedded and Distributed Knowledge-Based Systems // In Proceedings of the 2nd International Workshop on Computer Science and Information Technologies CSIT 200. Ufa, 2000. P. 103-111.
16. Кляйн Грахам. Среда описания ресурса (RDF): Понятия и абстрактный синтаксис.
http://www.w3.org/2007/03/rdf_concepts_ru/
17. Brickly Dan RDF Vocabulary Description Language 1.0: RDF Schema. Available at: http://www.w3.org/TR/2004/REC-rdf-schema-20040210.
18. Unified Modeling Language. Available at: http://www-01.ibm. com/software/rati onal/uml/.
19. SysML Open Source Specification Project. Available at: http://www.sysml.org/.
20. Эрик Прудхоммоукс. Язык запросов SPARQL для RDF. http://www.cambridgesemantics.com/semant ic-university/sparql-by-example.
21. Kalyanpur A. OWL: Capturing Semantic Information using a Standardized Web Ontology Language // Multilingual Computing & Technology Magazine. 2004. V. 15, issue 7. Available at: http://www.mindswap.org/papers/MultiLing. pdf (accessed 20.05.2011).
22. OWL Web Ontology Language Guide. Available at: http://www.w3.org/TR/owl-guide/.
23. OWL Web Ontology Language Use Cases and Requirements. Available at: http://www.w3.org/TR/2004/REC-webont-req-20040210/#onto-def.
24. Трофимов И.В. Эволюция выразительных способностей языка OWL. http://psta.psiras.ru/read/psta2011_4_85-94.pdf.
25. Steven Jenkins. Ontologies and Model-Based Systems Engineering // IN-COSE IW 2010 MBSE Workshop. California Institute of technology: Jet Propulsion Laboratory. February 2010.
26. NASA Exploration Information Ontology Model (OT^IOM) primer and vision. National Aeronautics and Space Administration, Headquarters Washington DC 20546. Washington, 2005. 18 p.
27. Kossiakoff Alexander. Systems engineering: principles and practice. Available at: http://www.incose.org/ProductsPubs/pdf/SE Vision2020_20071003_v2_03.pdf.
28. Welcome to protégé. Available at: http://protege.stanford.edu/.
29. Луцький М.Г. Розробка онто-логл безпеки aBÎa^ï // Iнженерiя програм-ного забезпечення. 2010. № 4. C. 56-62.
30. Боргест Н.М., Громов А.А., Морено Р.Х., Коровин М.Д., Шустова Д.В.,
Одинцова С.А., Князихина Ю.Е. Робот-проектант: фантазия или реальность // Онтология проектирования. 2012. № 4. С. 7394.
Боргест Николай Михайлович,
кандидат технических наук, профессор кафедры конструкции и проектирования летательных аппаратов, Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет). E-mail: [email protected]. Область научных интересов: онтология проектирования, системы автоматизированного проектирования.
Буракова Екатерина Евгеньевна, студентка, Самарский государственный аэрокосмический университет имени академика С. П. Королёва (национальный ис-
об авторах
следовательский университет). E-mail: [email protected]. Область научных интересов: системы автоматизированного проектирования, онтология производственной сферы.
Коровин Максим Дмитриевич, аспирант, Самарский государственный аэрокосмический университет имени академика С. П. Королёва (национальный исследовательский университет). E-mail: [email protected]. Область научных интересов: системы автоматизированного проектирования, искусственный интеллект.
ONTOLOGY DESCRIPTION LANGUAGES FOR HIGH-TECH FIELDS OF APPLIED ENGINEERING
© 2014 E. E. Burakova, N. M. Borgest, M. D. Korovin
Samara State Aerospace University, Russian Federation
The main task of ontology description languages is to describe semantics of domain data. Nowadays, ontology is the most common form of representation of semantically-interconnected data. Ontology consists of a set of concepts in a domain and relations between them. In this paper we consider the problems of existing toolkits for creating semantically-interconnected data storages for engineering domains and propose a solution in the form of an ontology. A modern approach to the classification of assets for ontology engineering is presented. The strengths and weaknesses of the approaches described are highlighted. The paper describes problems of structuring data in the engineering domain and the ways they can be solved using ontologies. A brief review of the common ontology description languages is given. Examples of the applied ontological approach in the database creation in the airspace engineering domain are presented. XML and HTML are highlighted as the most widespread languages in the description of subject areas in modern information systems. The OWL ontology description language is described in detail as the most promising ontology description language recommended by the W3C. Varieties of the OWL language are described in terms of their applicability to solving various problems of describing engineering domains taking into account the limitations of descriptive ability and complexity of the syntax of each version. Examples of the use of the OWL language in engineering domains are given.
Ontology, semantic web, formal languages, life cycle, engineering, data domain, databases, ontology description languages.
References
1. Ontology Summit 2013 Communique. Towards Ontology Evaluation across the Life Cycle. Available at: http://ontolog.cim3.net/cgi-bin/wiki.pl?OntologySummit2013_Communi que.
2. Conservative groupoids recognize only regular languages. Available at: http://www.academia.edu/9200925/Conserva tive_groupoids_recognize_only_regular_lang uages_Extended_Version_.
3. Gellish A. Product Modeling Language. Available at: http://sourceforge.net/apps/trac/gellish/#a5.1 TheGellishlanguage.
4. Orlando Chiarello, Dr. Knezevic Jezdimir The Role of Simplified Technical // English in Aviation Maintenance. 2013. No. 2. P. 36-38.
5. ASD Simplified Technical English-Specification ASD-STE100. Available at: http://www.asd-ste100.org/.
6. Simplified English.Available at: http://www.aecma.ru/.
7. Semantic Information Modeling in Formal English. Available at: http://www.gellish.net/.
8. Oscar Corcho. A Roadmap to Ontology Specification Languages. Available at: http://www.cs.man.ac.uk/~ocorcho/document s/ekaw00_CorchoGomezPerez.pdf.
9. Kazekin M.M. Istorya yazikov pred-stavleniya ontologii [History of the ontology description languages]. Available at: http://www.ict.edu.ru/ft/006054/2008_4_03-11.pdf.
10. Knowledge Interchange Format. Available at: http://www.ksl .stanford.edu/knowl edge-sharing/kif/.
11. CycL Syntax. Available at: http://www.cyc.com/cyc/cycl/syntax.
12. Negoda D. Yaziki predsavleniya ontologii [Ontology description languages]. Available at: http://callisto.nsu.ru/documentation/CSIR/qm eta/rus_237.pdf.
13. Share: News and Opinions about HTML. Available at: http://www.w3.org/html/.
14. Steven Pemberton. XHTML 1.0 The Extensible Hyper Text Markup Language. Available at: http://www.w3.org/TR/xhtml1/.
15. Soshnikov D. Software Toolkit for Building Embedded and Distributed Knowledge-Based Systems // In Proceedings of the 2nd International Workshop on Computer Science and Information Technologies CSIT 2000. Ufa, 2000. P. 103-111.
16. Klein Graham. Resource description framework (RDF): Concepts and basic syntax. Available at: http://www.w3.org/2007/03/rdf_concepts_ru/
17. Brickly Dan. RDF Vocabulary Description Language 1.0: RDF Schema. Available at: http://www.w3.org/TR/2004/REC-rdf-schema-20040210/.
18. Unified Modeling Language. Available at: http://www-01.ibm.com/software/rational/uml/.
19. SysML Open Source Specification Project. Available at: http://www.sysml.org/.
20. Prudhommuks Eric. SPARQL query language for RDF. Available at: http://www.cambridgesemantics.com/semant ic-university/sparql-by-example.
21. Kalyanpur A. OWL: Capturing Semantic Information using a Standardized Web Ontology Language // Multilingual Computing & Technology Magazine. 2004. V. 15, issue 7. Available at: http://www.mindswap.org/papers/MultiLing. pdf (accessed 20.05.2011).
22. OWL Web Ontology Language Guide. Available at: http://www.w3.org/TR/owl-guide/.
23. OWL Web Ontology Language Use Cases and Requirements. Available at: http://www.w3.org/TR/2004/REC-webont-req-20040210/#onto-def.
24. Trofimov I.V. Evolutsiya vyra-zitelnyh sposobnostey yazika OWL [Evolution of the OWL language description capabilities]. Available at:
http://psta.psiras.ru/read/psta2011_4_85-94.pdf.
25. Steven Jenkins. Ontologies and Model-Based Systems Engineering // IN-COSE IW 2010 MBSE Workshop. California Institute of technology: Jet Propulsion Laboratory. February 2010.
26. NASA Exploration Information Ontology Model (NExIOM) primer and vision. National Aeronautics and Space Administration, Headquarters Washington DC 20546. Washington, 2005. 18 p.
27. Alexander Kossiakoff. Systems engineering: principles and practice. Availa-
ble at:
http://www.incose.org/ProductsPubs/pdf/SE
Vision2020_20071003_v2_03.pdf.
28. Welcome to protégé. Available at: http://protege.stanford.edu/.
29. Lutzkiy M.G. Ontology development of aviation security // Engineering Software. 2010. No. 4. P. 56-62.
30. Borgest N.M., Gromov A.A., Moreno R.H., Korovin M.D., Shustova D.V., Odintsova S.A., Knyazihina Y.E. Robotdesigner: fantasy and reality // Ontology of designing. 2012. No. 4. P. 73-94. (In Russ.)
About the authors
Burakova Ekaterina Evgenievna,
undergraduate student, Department of Aircraft Design, Samara State Aerospace University, Russian Federation. E-mail: bee [email protected]. Area of Research: computer-aided design systems, ontology of the industrial sphere.
Borgest Nikolay Mihajlovich, Candidate of Science (Engineering), Professor, Department of Aircraft Design, Samara State Aerospace University, Russian Federation.
E-mail: [email protected]. Area of Research: ontology of designing, artificial intelligence, computer-aided design systems.
Korovin Maksim Dmitrievich, postgraduate student, Department of Aircraft Design, Samara State Aerospace University, Russian Federation. E-mail: [email protected]. Area of Research: computer-aided design systems, artificial intelligence.