Научная статья на тему 'Об использовании онтологий в информационных системах железнодорожного транспорта'

Об использовании онтологий в информационных системах железнодорожного транспорта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
266
60
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Корольков Борис Петрович, Дудакова Анастасия Владимировна

Рассматриваются онтологии и возможности их использования в качестве модели транспортной информационной системы

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об использовании онтологий в информационных системах железнодорожного транспорта»

Корольков Б.П., Дудакова А.В.

УДК 004.048

ОБ ИСПОЛЬЗОВАНИИ ОНТОЛОГИИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

Железнодорожный транспорт - одна из наиболее компьютеризированных отраслей народного хозяйства. Здесь создана уникальная магистральная цифровая сеть связи, ставшая технической основой широкого внедрения информационных технологий [1]. Осуществляется реализация федеральной целевой программы «Модернизация транспортной системы России (2002-2010 годы)», которая предусматривает совершенствование информационного обеспечения транспортной отрасли, в том числе функций государственного управления транспортом, сопровождения перевозок, обслуживания пользователей. Это особенно важно в свете необходимости применения логистических технологий, позволяющих повысить экономичность транспортного процесса, ускорить доставку пассажиров и грузов. Между тем уровень информационного взаимодействия внутри транспорта и с другими отраслями экономики всё ещё недостаточен, что сдерживает освоение международных транспортных коридоров в пределах России и интеграции её в мировую коммуникационную систему [2]. «Функционируют системы спасения и мониторинга на морском транспорте, развиваются информационные системы в авиации и автодорожном комплексе. Но все это развивается разрозненно и никак не увязано между собой» (зам. министра транспорта России А. С. Мишарин, газета «Гудок» от 20.04.2006).

В 2002 г. Минтрансом было принято решение о создании единого информационного пространства транспортного комплекса страны на базе единой магистральной цифровой сети связи российских железных дорог ОАО «РЖД». Определена одна из главных задач - внедрение новых информационных технологий с поэтапным переходом к полному интеллектуальному управлению во всех сферах своей деятельности. Такой подход соответствует существующим мировым тенденциям.

Решение проблемы обеспечения логистики перевозочного процесса предполагает на первом

этапе создание глобально-локальной базы данных [3]. В дальнейшем для анализа и оптимизационного поиска организации транспортных процессов потребуется более глубокая постановка задач моделирования. В виду сложности проблемы для её решения уже недостаточно традиционных экономико-математических методов и программных комплексов. Всё большее значение приобретает возможность использования, наряду с базами данных, средств извлечения знаний специалистов, локально возникающих, разрозненных и трудно формализуемых.

Прогресс в разработке новейших информационных технологий на основе баз знаний (интеллектуальных информационных систем) всё больше связывают с концепцией онтологий. Этот термин в информатике является производным от древнего философского понятия «онтология», что означает учение об основных свойствах, структуре и закономерностях предметной действительности (бытия). Впервые этот термин был употреблен в философском лексиконе Р. Гоклениуса как синоним метафизики (1613). Но исследования в области формального представления знаний начались ещё в глубокой древности. Первые попытки создания всеобъемлющих таксономий или классификаций относятся к античным временам (Аристотель). Большой вклад в развитие «формальной онтологии» внесли А. А. Богданов, Г. Фреге, Б. Рассел. В проблемах, связанных с искусственным интеллектом, под онтологией понимают знания, формально представленные на базе ориентированной на объект концептуализации [4].

Онтология становится посредником между различными способами представления информации - для чтения человеком и для компьютерной обработки. Онтологии получают распространение как средство представления знаний и инженерии знаний, семантической интеграции информационных ресурсов, информационного поиска.

Онтологический подход в задачах моделирования предметных областей рассматривается

как качественная возможность реализации системы представления и обработки научных знаний. Элементы этой системы представляют собой совокупность взаимосвязанных между собой объектов и процессов, в которых эти объекты тем или иным образом участвуют. Онтологическое исследование подобных сложных систем позволяет извлекать ценную информацию об их работе, которая имеет значение для анализа и использования накопленных знаний, реорганизации существующей либо построения новой информационной системы.

Определение онтологий и классификация по уровням обобщения в них понятий весьма условны. В инженерии знаний под онтологией понимается детальное описание некоторой предметной области, которое используется для формального и декларативного определения ее концептуализации. Онтология - это точная спецификация некоторой области, которая включает в себя словарь терминов предметной области и множество связей (типа «элемент - класс», «часть - целое»), которые описывают, как эти термины соотносятся между собой. Онтологии - это разновидность модели информационной системы, которая позволяет лучше понять и сформулировать существенные свойства реальной сложной системы.

Онтологию в определенной мере можно сопоставить с другой укрупнённой моделью сложной системы - систематикой. Систематика - это упорядоченное описание всей совокупности объектов некоторой сферы реальности. Как наиболее полная классификация, она создаётся с целью облегчить ориентировку в многообразии объектов, дать обеспечение решения вопросов стратегии использования как наличности, так и когда-либо существовавших структур, форм, видов. Систематика, решая задачу упорядочения обозначений и описания выделенного множества объектов в некоторой области реальной действительности, формирует однородные группы, называемые таксонами. Таксоны, в зависимости от количества признаков и размера множества так или иначе сгруппированных объектов, образуют иерархическую структуру соподчинения с нарастанием степени обобщённости от нижних уровней (рангов) к верхним [5].

Онтологии объекта исследования тоже ие-рархичны [6,7] и имеют ту же тенденцию нарастания уровня абстрактности:

- онтологии верхнего уровня (описывают наиболее общие понятия);

- онтологии предметной области (описывают понятия, связанные с предметной областью);

- онтологии задач (описывают понятия, связанные с конкретной задачей);

- онтологии приложения (формальное описание конкретной реализации задачи).

Онтологии разных уровней можно сравнить с ранговыми категориями универсальной систематики: обе не привязаны ни к какой конкретике, за исключением иерархичности (структуры системы). Абстрактная иерархическая систематика представляет собой несвязный (направленный) граф - дерево. По существу такой граф можно рассматривать как некоторую рамочную конструкцию, которая в приложениях должна наполняться конкретным содержанием. Онтология предметной области в некотором отношении сродни систематике, но в последней, наряду с обобщёнными рангами, содержится конкретная номенклатура (названия таксонов). Отсюда видна возможность объединения онтологии и систематики. В качестве примера можно привести систематику подвижного состава железнодорожного транспорта [3], а также контейнерного парка разработанную в ИрГУПС и примененную для целей инвентаризационного кодирования объектов более широкого класса - уникальных изделий [8].

К основным задачам, которые могут решаться на основе онтологий относятся:

- представление знаний для релевантного ориентированного поиска и вывода информации в локальных и глобальных поисковых системах;

- фильтрация и классификация формализованных знаний предметных областей;

- организация общей и предметной терминологии (как в систематике);

- индексирование собранных данных и выделение концептуальных знаний.

Следует отметить, что онтология является не только целью создания базы знаний, но и средством формирования систем управления знаниями. Онтологическое исследование позволяет, в принципе, описать построение системы управления национальными и международными перевозками. Разработка онтологий аналогична определению набора данных и их структуры для использования различными приложениями. В работе [3] впервые высказывается мысль о возможности построения онтологий в области транспорта на базе универсального кода транспортной единицы и его описания модели данных в терминах «сущность-связь». В реляционной базе данных (адекватной логистической задаче) предлагается хранить не только информацию о транспортных единицах, но и сведения по её структуре, т. е. метаданные. Онтологии, как и систематика сложных систем, обла-

дают структурой типа «матрешки». Метаданные могут содержать ранговые данные, а они, в свою очередь, конкретные данные и их значения. Благодаря применению метаданных возможна реализация простых алгоритмов для обработки сущностей и их атрибутов, так как структура хранения для любых объектов одинакова и является рамочной. Таблицы, содержащие фрагменты кода и расшифровки их значений логически представляют собой отдельные сущности, что позволяет легко организовывать распределенное хранение данных в локальных и глобальных ИТ-системах. Метаданные, становясь доступными для поисковых машин, позволяют проводить семантический отбор необходимой информации.

Основная задача онтологического подхода состоит в том, чтобы облегчить пользователю извлечение информации из большого набора интеллектуальных ресурсов за счет систематизации знаний, создания единой иерархии понятий, унификации терминов и правил интерпретации.

Современные онтологии строятся по большей степени одинаково, независимо от языка описания. Обычно они состоят из экземпляров или объектов, понятий, атрибутов и отношений [9]. Экземпляры - это основные, нижнеуровневые компоненты онтологии. Ими могут быть как физические обьекты (вагоны, локомотивы), так и абстрактные (числа, слова). Строго говоря, онтология может обойтись и без конкретных объектов. Однако одной из главных её целей является классификация таких объектов, поэтому они также включаются. Понятия или классы формально выделяют общие (сходные) признаки предметов и явлений и закрепляют их в словах. Атрибут - это необходимое, существенное, неотъемлемое свойство объекта. По типу отношений можно выделить следующие типы онтологий [10]:

1) таксономия - ведущее отношение «класс-подкласс»;

2) партономия - ведущее отношение «состоит из»;

3) генеалогия - ведущее отношение «отец-

сын»;

4) атрибутивные структуры («свойство», «значение свойства»);

5) причинно-следственные - ведущее отношение «если-то»;

6) смешанные онтологии - онтологии с другими типами отношений.

Самый простой способ описания концептов предметной области - атрибутивная онтология; более удачный - формирование таксономии - выделение классов по какому-либо (одному или не-

скольким) признакам. Таксономическая проработка подсистемы подвижной состав железнодорожного транспорта осуществлена в [3, 5] и может быть использована для обсуждаемых целей.

Теория пока не предлагает универсальной методики разработки онтологий. Кроме того, понятие их «правильности» может быть определено только для каждого конкретного примера, с учетом назначения онтологии и общих целей разработки [11]. Онтологическое исследование сложных систем, или ее онтологический анализ, объединяет две основные технологии - объектно-ориентированный и структурный анализ. Целью онтологического анализа является выявление функциональной структуры системы (объектов и их связей) и определение поведения системы (сценариев). Результатом выполнения такого анализа фактически и является разработка онтологии [6].

Процесс построения онтологии, согласно методологии, сформулированной в стандарте онтологического исследования ГОБР5, состоит из ряда этапов:

- изучение и систематизирование начальных условий, в результате которого устанавливаются основные цели проекта разработки онтологии, а также распределяются роли между участниками проекта;

- сбор и накопление необходимых начальных данных для построения онтологии;

- анализ и группировка собранных данных для облегчения построения терминологии;

- формулирование начальной или предварительной онтологии на основе отобранных данных;

- уточнение и утверждение онтологии.

Часть из них совпадает с этапами систематического анализа объектов транспортной инфраструктуры [3]. Методология ГОБР5 определяет процесс создания онтологии в сильно обобщенном виде. С целью обеспечения поддержки процесса построения онтологии в ГОБР5 существуют онтологические языки.

Поскольку информационная система (ИС) любой отрасли в целом содержит ресурсы по различным предметным областям, то наиболее целесообразным подходом, по-видимому, является создание специализированных онтологий по данным ресурсам с последующей интеграцией частных онтологий в онтологию верхнего уровня (фактически, схему, описывающее информационный контент ИС) [12].

В сфере железнодорожных перевозок построение онтологии, например, контейнерной системы могло бы помочь пользователям в систематизации знаний и поиску данных, сконцентриро-

ванных в единой транспортной ИС. Возможный вариант работы с такой организацией информации представлен на рис. 1.

Вход в систему

1 г

Общая онтология

1 г

Частная онтология

1 г

Инте щее ;ресую-понятие

Данные, связанные с этим понятием

Рис. 1. Алгоритм работы в ИС, основанной на онтологиях

При входе в систему пользователю предъявляется онтология, позволяющая сориентироваться в «пространстве предметных областей», информацию о которых содержит данная ИС. Последовательно переходя от общей онтологии к одной из частных, пользователь может найти интересующее его понятие, при этом видеть количество единиц информации, связанных с ним, проанализировать место этого понятия среди остальных в данной предметной области. На следующем этапе происходит просмотр данных, связанных тем или иным способом с любым концептом онтологии.

Основным преимуществом онтологического подхода является целостное видение автоматизации исследований. При этом достигаются:

- системность - онтология представляет целостный взгляд на каждую предметную область;

- единообразие - знание, представленное в единой форме гораздо лучше воспринимается и воспроизводится;

- научность - построение онтологии позволяет восстановить недостающие логические связи [6].

Формирование онтологии в общем случае позволяет решить несколько проблем [7]:

- совместное использование людьми или программными компонентами общей структуры информации;

- обеспечение возможности повторного использования и интеграции с онтологиями других разделов данной предметной области;

- создание явных спецификаций знаний, полезных для новых пользователей, которые должны узнать значения терминов предметной области, а также позволяющих изменять эти спецификации при расширении знаний;

- отделение знаний предметной области от оперативных знаний и возможность универсального использования онтологии для решения других задач.

Вопрос взаимодействия имеет большое значение для конструирования полноценной онтологии. Необходимо разработать средства интеграции конкретной онтологии с другими, уже существующими или предусмотренными в будущем. Уже сейчас такая возможность реализована с применением стека протоколов, разработанных для идеи Semantic Web, учитывающей возможности повторного использования онтологий и общих словарей терминов в качестве своей основной парадигмы [13]. Можно выделить следующие базовые способы описания онтологий, пользующиеся популярностью у исследователей в последнее время:

UML (Unified Modeling Language) - унифицированный язык моделирования;

RDFS (the Resource Description Framework Scheme) - структура представления ресурса, ясный набор правил для обеспечения простой описательной информации. Даёт способ объединения таких описаний в единственный словарь. RDF является мощной структурой для поддержки обмена знаниями в среде Web;

OWL (Web Ontology Language) - язык Web онтологий, т.е. язык определенно структурированных основанных на сети онтологий. Допускает более богатое объединение и интероперабельность данных в среде описательных сообществ.

Онтологический подход - это одно из направлений решения проблемы универсального представления концептуальных знаний в современных информационных системах самого различного назначения. На основе онтологий в настоящее время уже решаются многие задачи, связанные с формализованным описанием различных информационных систем, представлением их структуры и описанием взаимосвязей между различными компонентами таких систем. Онтологии вполне можно рассматривать как модель информационной системы того или иного уровня, помо-

гающую описать структуру в формализованном виде, удобном для автоматической обработки.

Таким образом, разработка совокупности онтологий, описывающих транспортную систему на разных уровнях обобщения, позволит повысить степень формализации знаний в данной области, и тем самым привлечь методы искусственного интеллекта, способствующие повышению эффективности принятия решений и качества управления. Систематики конкретных производственных областей могут оказаться удачными дополнениями к основному назначению онтологий.

БИБЛИОГРАФИЯ

1. Стреж, С. В. Организация информационного пространства / С. В. Стреж, Е. В. Трошин, А. Н. Шулунов // Железнодорожный транспорт. - 2005. - № 9. - С. 38-40.

2. Ицкович, Б. С. На пути к созданию единого информационного ресурса / Б. С. Ицкович // Железнодорожный транспорт. - 2005. - № 5. -С. 36-37.

3. Корольков, П. Б. Разработка единой системы кодирования подвижного состава железнодорожного транспорта : специальность 05.13.01 : автореф. дис. на соиск. учен. степ. канд. техн. наук / Корольков Пётр Борисович. ; Иркут. гос. ун-т путей сообщ. - Иркутск., 2006. - 24 с.

4. Гаврилова, Т. А. Базы знаний интеллектуальных систем : учеб. / Т. А. Гаврилова, В. Ф. Хорошевский. - СПб. : Питер, 2001. - 384 с.

5. Корольков, Б. П. О построении универсальной систематики / Борис Корольков // Транспорт. Наука. Техника. Управление. - 2003. - № 10. -С. 37-44.

6. Ворожцова, Т. Н. Онтологический подход к моделированию программного комплекса / Т. Н. Ворожцова, С. К. Скрипкин // Вестн. Ир-ГТУ. - 2006. - № 2 (26). - С.72-78.

7. Ворожцова, Т. Н. Моделирование программно-вычислительных комплексов на основе онто-логий / Т. Н. Ворожцова, С. К. Скрипкин //

Информационные и математические технологии в науке, технике и образовании : тр. X Байкал. Всерос. конф. / ИСЭМ СО РАН. - Иркутск, 2005. - Ч. I. - С. 87-94. - ISBN 5-93908037-5.

Корольков, Б. П. Проблема универсального кодирования объектов уникального ряда / Б. П. Корольков, П. Б. Корольков // Системный анализ в проектировании и управлении : тр. X ме-ждунар. науч.-практ. конф. / Санкт-Петербург. гос. политехн. ун-т. - СПб., 2006. - С. 110-113.

9.

Категория: онтология : материал из Википедии

- свободной энциклопедии // ВикипедиЯ : свобод. энциклоп. / MediaWiki. - М., [Б. г.]. - Режим доступа : http://ru.wikipedia.org/wiki/Онтология, свободный. - 06.02.2008.

10. Гаврилова, Т. А. Управление знаниями: что делать? / Татьяна Гаврилова // Реинжиниринг бизнес-процессов. Системы управления знаниями : сб. докл. 7-й конф. /МЭСИ. - М., 2004.

- С. 61-67.

11. Гаврилова, Т. А. Об одном подходе к созданию атрибутивных онтологий и таксономий / Т. А. Гаврилова, Е. Е. Веселова // Системный анализ в проектировании и управлении : тр. X меж-дун. науч.-практ. конф. / Санкт.-Петербург. гос. политехн. ун-т. - СПб., 2006. - Ч. 2. - С. 283-285.

12. Новые технологии для понятийных сетей, создаваемых в рамках МНТП «Вакцины нового поколения и диагностические системы будущего» / А. В. Жучков [и др.] // Электронные библиотеки. - 2003. - Т. 6., вып. 6. - URL http://www.elbib.ru/index.phtml ?page=elbib/rus/j ournal/2003/part6/ZATGS (дата обращения : 06.02.2009).

13. Костюченко, А. П. Разработка инструментальной системы для создания онтологий системных исследований в энергетике / А. П. Костю-ченко // Вестн. ИрГТУ. - 2006. - № 2(26). - С. 97-101.

i Надоели баннеры? Вы всегда можете отключить рекламу.