Научная статья на тему 'Использование онтологий для создания баз общих знаний при классификации информации о предметной области'

Использование онтологий для создания баз общих знаний при классификации информации о предметной области Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
261
84
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Квятковская Ирина Юрьевна

Определяются способы спецификации предметной области в виде онтологии. Рассматриваются вопросы создания информационной инфраструктуры Астраханского транспортного узла на основе объединенных баз знаний. Обобщены перспективы использования онтологий для решения проблем проектирования обеспечивающих информационных систем на базе корпоративной памяти, создаваемой специалистами различного профиля. Представлены аспекты классификации и систематизации информации с использованием онтологий. Библиогр. 4.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Specification ways of a data domain in the form of ontology are determined in the paper. Problems of creation of an information infrastructure of the Astrakhan transport unit on the basis of general knowledge bases are considered there. Prospects of ontology use for problem solving of providing information systems designing on the basis of corporate memory created by experts of a various structure, are generalized. Classification aspects and systematization of information with ontology use are also presented there.

Текст научной работы на тему «Использование онтологий для создания баз общих знаний при классификации информации о предметной области»

УДК 681.3.06

И. Ю. Квятковская Астраханский государственный технический университет

ИСПОЛЬЗОВАНИЕ ОНТОЛОГИЙ ДЛЯ СОЗДАНИЯ БАЗ ОБЩИХ ЗНАНИЙ ПРИ КЛАССИФИКАЦИИ ИНФОРМАЦИИ О ПРЕДМЕТНОЙ ОБЛАСТИ

Процесс создания любой информационной среды заключается в объединении группы гетерогенных потоков, поступающих из внешних источников, в ядро - информационную систему. Практика показывает, что типовой ошибкой многих вновь проектируемых информационных систем является превосходство средств программной реализации над предметной постановкой. Возникает проблема консолидации знаний о предметной области, выраженной как на естественном, так и на искусственном языке, проблема системного единства знаний, открывающая возможность воплощения в материальный объект.

Целью данной работы являлось определение способов спецификации предметной области в виде единой системы формального и декларативного представления для представления и обмена знаниями - онтологии.

Самым общеупотребительным является следующее определение онтологии: онтология -точная (выраженная формальными средствами) спецификация концептуализации [1, 2]. В данном случае она выступает как система соглашений о некоторой области, обеспечивающая одинаковое понимание всеми пользователями терминов, применяемых для решения задачи их спецификаций, атрибутов и отношений между ними [3]. В онтологии зафиксирована та часть концептуализации, которая зависима от взглядов на предметную область.

Онтологический инжиниринг включает в себя совокупность действий, связанных:

- с процессом разработки онтологий;

- жизненным циклом онтологий;

- методами, методологией и стандартами построения онтологий;

- инструментарием для их создания и поддержки в рамках заданной нотации.

Стандартом онтологии является IDEF5 [4], в рамках которого выделено 5 этапов:

1. Формирование цели, контекста разработки онтологии.

2. Накопление информации для разработки онтологии.

3. Анализ и систематизация собранной информации для унификации терминологии.

4. Формирование первоначального макета онтологии на основе систематизированных данных.

5. Развитие, уточнение онтологии.

Стандарт IDEF5 достаточно декларативный, поскольку в настоящее время не существует программных средств, полностью его поддерживающих и охватывающих все этапы построения онтологий. Тем не менее существует несколько методологий создания онтологий на базе инструментальных средств Ontology Design Environment, Smarter Knowledge Suite и др. Самым перспективным является визуальное конструирование онтологии, представляющее ее в виде сети концептов и связей между ними. Концепты универсальны для некоторого класса и описываются набором атрибутов. При необходимости возможно задавать конкретные значения атрибутам, определяя также тип их данных, заполняя онтологию. Связи имеют различный характер: «имеет», «влияет», «является», «представляет» и т. д.

В качестве предметной области может быть рассмотрен процесс транспортировки и перевалки грузов в зоне действия международного транспортного коридора «Север - Юг» в Астраханском регионе. Вновь разработанная онтология, составленная на базе классифицированной информации о предметной области, может быть использована для решения следующих задач.

1. Совместное видение проблемы.

Рассмотрим группу разработчиков информационной инфраструктуры, позволяющей повысить эффективность управления таким сложным материальным объектом, как Астраханский транспортный узел. Территориальная распределенность его подсистем, объединение водных, автомобильных, железнодорожных путей и направлений, разнородная функциональность, большое количество технологических схем по перевалке груза и другие факторы вызывают

необходимость согласовывать мнения специалистов различного профиля. Среди них - будущие пользователи информационных систем - грузовладельцы, грузоперевозчики, транспортные агенты, таможенные брокеры, предпочитающие говорить о таких вещах, как груз, его страховка, маркировка, схемы транспортирования, таможенный досмотр. Те, кто готовит компьютерное обеспечение данных систем, сконцентрированы на информационных процессах, обеспечивающих их синхронную работу. Специалисты по сетям занимаются топологией информационной сети и ее эксплуатационным обслуживанием и внедрением, информатики-аналитики обрабатывают оперативную информацию о текущем состоянии объекта, специалисты по безопасности решают практические вопросы защиты циркулирующей информации в зависимости от ее приоритетов, также основываясь на знании предметной области. Таким образом, представления разработчиков направлены на совершенно разные системы. Задача унификации объектов, описанных различными представителями участников Астраханского транспортного узла, является главной при разработке единой информационной среды, онтологической проблемой формирования целого.

2. Формирование баз общих знаний для различных информационных систем.

Необходимость разработки систем управления знаний, построенных на онтологии, вызвана следующими проблемами:

— опыт наиболее квалифицированных специалистов используется лишь ими самими;

— необходимая информация затеряна в огромном количестве документов, доступ к которым затруднен или каталогизация которых вообще отсутствует;

— работники предприятий тратят значительное количество времени на поиск нужной информации.

Одним из способов решения является создание корпоративной памяти, представленной в виде баз данных и знаний. Корпоративная память позволит зафиксировать информацию, переданную на естественном языке, в виде онтологии и предложить ее различным специалистам для последующего использования. Поскольку первичная информация может быть представлена в виде справочников, документов, статей, схем, чертежей, аудио- и видеофрагментов, алгоритмов и программ, процедура ее формализации затрудняется. Построение онтологии общих знаний под силу только при комплексном участии всех субъектов, имеющих отношение к транспортному процессу. Принцип их организации должен использовать Web-технологии с поддержкой открытого доступа. Создание Web-онтологии должно осуществляться на каком-либо корпоративном портале и выражать трехуровневое представление отражаемых знаний в виде иерархии: в вершине - общих онтологий, затем - предметных онтологий и онтологий задач. Предметная онтология содержит понятия, необходимые для описания предметной области. Онтология задач содержит в рамках понятий решаемые задачи, декомпозируемые на подзадачи.

Следует отметить, что на базе онтологий возможно решение большинства предметных задач по созданию информационных ресурсов, согласование информационных моделей программно-технического комплекса, поддержка этапов его реализации и внедрения.

2. Представление структуры и смысла метаданных в информационных ресурсах.

Процесс создания информационных ресурсов любой организации связан с решением большого числа задач по систематизации и пониманию компьютером документов, основанных на использовании метаданных. Всякий информационный ресурс, использующий услуги инфраструктуры, должен иметь метаданные - описание, представленное в электронной форме, доступное для автоматизированной обработки. Система метаданных выступает в качестве центрального звена любой информационной системы. В рамках данной задачи онтологии применяются при формировании пространств словарей, справочников, идентификаторов, имен для унификации понятий и единообразия их интерпретации. Описание терминов, используемых в метаданных в виде онтологий, позволит повысить точность компьютерной обработки метаданных до семантического уровня.

При создании единой информационной инфраструктуры, объединяющей субъектов транспортного коридора «Север - Юг», подобная задача возникает вследствие необходимости решения задач каталогизации и классификации имеющихся информационных ресурсов и определения места в подобной классификации для вновь создаваемых ресурсов. Ситуация, сложившаяся в настоящее время, свидетельствует об отсутствии координации при создании аналитиче-

ских метаданных на информационных порталах г. Астрахани и других регионов. Разработка структуры представляемой информации производится разработчиками на местах, вследствие чего затрудняются или вообще отсутствуют ссылочные связи между порталами.

3. Организация эффективного поиска в базах данных и базах знаний.

Использование онтологии позволяет точнее интерпретировать смысл терминов, присутствующих в поисковых запросах, сокращая возможную неполноту ответа на него. Семантическое представление запроса уточняется на основании категоризации онтологии, позволяя использовать отношения «система - подсистема», «целое - часть». Онтология также позволит производить автоматизированную обработку семантики информации, представленной в Интернет, с целью ее эффективного представления, поиска, преобразования. Принцип обработки данных обеспечит семантическую интероперабельность информационных ресурсов.

4. Объединение знаний о предметной области путем создания метаонтологий.

В процессе консолидации знаний о предметной области, уже выраженных в виде онтологии знаний, возможно создание объединяющей их метаонтологии. Что же делать, если какая-либо часть предметной области описана в виде онтологии сообразно представлениям и взглядам специалистов различных областей, например транспортников и IT-аналитиков? В случае, если локальные онтологии не соответствуют или противоречат друг другу, необходимо найти соответствие между онтологиями путем выполнения следующих этапов:

- отображение онтологии - поиск семантических связей подобных элементов из разных онтологий;

- выравнивание онтологий - установка соответствия и связи между двумя онтологиями, повторное их сохранение на основе создания списка конфликтов и возможных решений этих конфликтов;

- объединение онтологий - трансформация двух исходных онтологий в одну согласованную. Разработанные онтологии будут являться основой систем управления знаниями о субъектах,

процессах, ресурсном обеспечении, информационных ресурсах Астраханского транспортного узла.

СПИСОК ЛИТЕРАТУРЫ

1. Guarino N., Guaretta P. Ontologies and Knowledge Bases. Towards a Technological Clarification // Towards Very Large Knowledge Bases. - Amsterdam: IOS Press, 1995.

2. Gruber T. R. A translation approach to portable ontologies // Knowledge Acquisition. - 1993. - N 5 (2). -P. 199-200.

3. Башмаков А. И., Башмаков И. А. Интеллектуальные информационные технологии: Учеб. пособие. -М.: Изд-во МГТУ им. Н. Э. Баумана, 2005. - 304 с.

4. IDEF5 Method Report / Knowledge Base System, Inc. - College Station, Texas: KBS, 1994. - 188 p.

Статья поступила в редакцию 14.10.2006

ONTOLOGY USE FOR GENERAL KNOWLEDGE BASES CREATING AT INFORMATION CLASSIFICATION ON A DATA DOMAIN

I. Yu. Kvyatkovskaya

Specification ways of a data domain in the form of ontology are determined in the paper. Problems of creation of an information infrastructure of the Astrakhan transport unit on the basis of general knowledge bases are considered there. Prospects of ontology use for problem solving of providing information systems designing on the basis of corporate memory created by experts of a various structure, are generalized. Classification aspects and systematization of information with ontology use are also presented there.

i Надоели баннеры? Вы всегда можете отключить рекламу.