Научная статья на тему 'Разработка инструментальной системы для создания онтологии системных исследований в энергетике'

Разработка инструментальной системы для создания онтологии системных исследований в энергетике Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
82
20
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Костюченко Алексей Петрович

Рассмотрены средства, технологии и подход к построению инструментальной системы создания онтологии, Приве дено описание созданной системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка инструментальной системы для создания онтологии системных исследований в энергетике»

10, Клер A.M., Скрипкин С,К., Ворожцова Т.Н. Проблемы математического моделирования и оптимизации схем и параметров теплоэнергетических установок // Системные исследования проблем энергетики, - Новосибирск: Наука, 2000,

11. Максимов A.C. Модернизация СМПП и решение с ее помощью задач адаптации математических моделей теплофикационных турбин II Сб. трудов Научно-технический прогресс в энергетике, - Иркутск: ИСЭМ СО РАН, 2004, - С, 120-129,

А.П.Костюченко

Разработка инструментальной системы для создания онтологий системных исследований в энергетике

Введение. Проведение системных исследований в энергетике предполагает комплексный подход, требующий совместного рассмотрения объектов энергетики, их функционирования и перспектив развития, В настоящее время отсутствуют компьютеризированные системы представления и обработки научных знаний в энергетике, Вместе с тем, необходимость их создания является актуальной, учитывая ряд факторов:

1) создание и развитие Интегрированной системы информационных ресурсов РАН (ИСИР РАН) и Информационной системы СО РАН, в которых желательно отражать результаты системных исследований в энергетике;

2) существующий разрыв между учеными старшего поколения и молодежью (отсутствие либо недостаточность среднего звена) и необходимость сохранения уникальных знаний старшего поколения;

3) выполняющаяся в ИСЭМ СО РАН разработка ИТ-инфраструктуры системных исследований в энергетике, в рамках которой необходимо решать задачу общего понимания структуры информации и ее совместного использования.

Кроме того, необходимо учитывать существующую в Internet тенденцию перехода к семантическим Web, с тем, чтобы был возможен поиск не только по ключевым словам, но и по смыслу.

Существуют различные подходы, модели и языки описания знаний. Однако все большую и вполне заслуженную популярность последнее время приобретают онтологии. Онтологии позволяют осуществлять автоматизированную обработку семантики информации и ее представление, с целью эффективного использования (преобразования, поиска), Соответствующая технология базируется не на осмыслении информации человеком, а на обеспечении семантической интероперабельности информационных ресурсов, т.е. на автоматизированной интерпретации и обработке информации.

Актуальность разработки онтологий для системных исследований в энергетике приводит к необходимости использования программной среды для облегчения трудоемкого процесса построения онтологий. Несмотря на то, что, по данным консорциума W3C, уже существуют более 50 готовых инструментов редактирования онтологий [1], их основными недостатками являются:

1) слабая выразительность графического представления таксономии концептов;

2) ограниченный набор функциональных возможностей средств интероперабельности (некоторые инструменты не имеют возможности импорта/экспорта в формате OWL);

3) возможности расширяемости приложения зачастую отсутствуют;

4) неудобная реализация пользовательских интерфейсов.

Путь к решению проблемы выбора оптимального инструмента напрашивается сам по себе и заключается в создании собственной программной среды, учитывающей и исключающей недостатки существующих систем.

Проектирование инструмента для создания онтологий предполагает определение следующих ключевых моментов:

1) выбор методологии;

2) выбор языка хранения знаний;

3) формализм описания онтологий;

4) метод хранения онтологий (файлы/СУБД);

5) определение внутренних функциональных возможностей (проверка непротиворечивости);

6) определение сервисных функций (метод графического представления, импорт и экспорт в различные форматы).

Онтология в формальном стиле описывает взаимосвязи между объектами и свойства объектов конкретной предметной области. При этом онтология имеет вполне определенную структуру, состоящую из двух блоков [2]:

1) таксономии;

2) набора логических свойств предметной области и правил вывода.

Исходя из этого, можно предложить блочную композицию предложений по организации среды для создания онто-логий,

Таксономия. Базовая составляющая онтологии - таксономия - определяет классы объектов и взаимодействие между этими классами, Ключевыми здесь являются понятия подкласса, суперкласса и наследования. Например, класс «Электроэнергетические системы» является подклассом класса «ТЭК».

В данном случае прямоугольники изображают классы объектов, а стрелки обозначают наследование, Таким образом, можно сформулировать очевидные включения:

Класс (ЭНЕРГЕТИКА) с Класс(ТЭК)

Кпасс(ТЭК) с; Класс(ЭнергетическиеСистемы) и Класс(СистемыГазоснабжения)....

Рис. 1, Фрагмент таксономии ТЭК

Система классов, подклассов и свойств классов является универсальным и выразительным инструментом представления знаний, Можно формализовать большое количество отношений между элементами, описывая свойства класса, а значит (по схеме наследования), и его подклассов.

На данном этапе формулирования предложений требуется решить вопрос о выборе языка организации таксономии. В настоящее время существует и используется большое количество средств для представления знаний; ОКВС, OWL, OCML, OXML. Учитывая возможность применения онтологий в глобальной сети, нужно учесть, что важнейшей задачей при построении глобальной системы формализованных знаний является правильный выбор логической схемы, которая, с одной стороны, должна быть достаточно выразительной, а с другой - понятной специалистам. Очень важно, чтобы логическая схема была легкой с алгоритмической точки зрения, Кроме того, необходимо стандартизовать сам язык представления знаний, чтобы его могли одинаково понимать, как сегодня понимают, например, HTML. В качестве данной возможности У/З-консорциум сегодня развивает проект языка OWL (Web Ontology Language), удовлетворяющего вышеперечисленным критериям.

Правила вывода. Ключевым механизмом работы с онтологиями должна стать система вывода, которая позволит получать необходимые знания на основе имеющихся, Правила вывода должны определять весьма простую логическую систему, В языке онтологий OWL, если это перевести на язык логики первого порядка, допускаются [2]:

1) средства для построения иерархии классов объектов;

2) одноместные предикаты, определяющие принадлежность элемента классу;

3) двуместные отношения, связывающие два объекта друг с другом;

4) ограниченный набор свойств, которые могут характеризовать используемые предикаты, например, транзитивность, симметричность, функциональность, обратная функциональность и т.д.

Механизм вывода. Помимо средств записи знаний предметной области предполагается использование инструмента, способного делать необходимые умозаключения на основе имеющихся знаний. Таким средством могут послужить декларативные языки программирования, в частности Prolog. Prolog - логический язык программирования, на основе которого можно построить практически любую форму логических рассуждений, записанных в виде предикатов, Например, можно определить предикат «Синоним» и ввести в систему следующие правила:

Синоним(Х,У) |-> Синоним(У,Х)

Синоним(Х,У) , Chhohhm(X,Z) |-> Y=Z

Определив тем самым отношение «Синоним» как транзитивное и функциональное. Подобным образом накопление знаний в формате языка Prolog из записей в синтаксисе OWL представляется алгоритмически возможным. Применение логического языка в данном контексте предоставит возможность:

1) делать выводы из накопленных знаний, что приведет к возможности более полного моделирования онтологий;

2) проверки непротиворечивости (выявление конфликтов и несогласованностей, выявление семантических различий между терминами),

Интероперабельность. Существует еще один важный вопрос, который необходимо рассмотреть для того, чтобы организовать полноценную онтологию - это вопрос взаимодействия онтологий, Необходимо предоставить средства интеграции конкретной онтологии с другими, уже существующими или предусмотренными в будущем. Такая возможность уже реализована с применением стека протоколов, разработанных для идеи Semantic Web, учитывающей возможности повторного использования онтологий и общих словарей терминов в качестве своей основной парадигмы. Основные инструменты для реализации идеи Semantic Web предоставляют следующие возможности:

1) XML позволяет описать синтаксическую составляющую структурированных документов, но не имеет средств для отображения семантики документа;

2) XML Schema - язык, определяющий структуру XML документа, а также расширяющий XML типами данных;

3) RDF - это модель данных, основанная на описании объектов ("ресурсов") и отношений между ними;

4) RDF Schema - это словарь, описывающий свойства и классы RDF ресурсов. RDF Schema несет в себе семантическую составляющую, с помощью которой строится иерархия классов;

5) OWL добавляет дополнительные средства для описания классов и свойств; отношения между классами (например, непересекаемость), мощность, эквивалентность, разнообразные типы свойств, характеристики свойств, enumerated classes.

Интересно, что вышеописанный подход к реализации Semantic Web представляется как аналог разрабатывающихся сегодня проектов openSourse [3], где эксперты описывают определенные предметные области, а эти описания становятся частью более общей онтологии.

На рис, 2 изображена концептуальная схема среды разработки онтологий, спроектированной с учетом изложенных фактов.

Рис. 2. Концептуальная схема инструментальной системы

В качестве примера на рис.3 приведен пользовательский интерфейс описания классов реализованной инструментальной системы,

Для реализации инструментальной системы в качестве технологии для хранения онтологий был избран формат OWL DL. OWL DL обеспечивает максимальные выразительные возможности при сохранении вычислительной полноты (все выводы гарантированно вычислимы) и разрешимости (все вычисления будут завершаться в конечное время). Название этого подъязыка (из трех уровней стандарта OWL) включает аббревиатуру DL, указывающую, что он основан на логике описаний (Description Logics) - классе логик, представляющих собой разрешимые подмножества логик первого порядка. Этот подъязык включает все конструкции OWL, но они должны использоваться с определенными ограничениями, которые в предлагаемой системе находятся под контролем машины вывода, Структурная схема ИС приведена на рис. 4.

Графическое представление таксономии. В качестве- методологии для графического представления таксономии используется стандарт IDEF5, а именно схематический язык SL (Schematic Language). SL является наглядным графическим языком, специально предназначенным для изложения компетентными специалистами в рассматриваемой области системы основных знаний в форме онтологий [4], Этот язык позволяет естественным образом представлять основное содержание онтологии и дополнять существующие онтологии новыми знаниями.

йайл Нсйс'<ч

Р«окт«осгэдо#ы {.Гцвфичеею» Лйает*».*»«« |

-•т х)

Масс* |Олы( Счт>ясги|

ШМШШ

Злектрсочергетячеоч« с-тете»-*; ■ Системы г&зослабжеинг Системы

Системы ужп&бхкыя

З^бда - Участки Шахте

Рис. 3. Пример интерфейса описания классов

Рис. 4. Структурная схема ИС

51 позволяет строить разнообразные типы диаграмм и схем в ЮЕР5. Основная цель всех этих диаграмм - наглядно и визуально представлять основное содержание онтологии. Графические средства описания структуры объектов предметной области реализуют возможность представления знаний в разрезе:

1) классификации;

2) композиции;

3) схемы взаимосвязей;

4) процессов изменения объектов [5].

Это делает возможным определять наиболее полезные свойства инструментальной системы для повышения эффективности описания модели предметной области. Стандарт ЮЕР5 предоставляет структурированную методологию, с помощью которой можно наглядно и эффективно разрабатывать, поддерживать и изучать эту онтологию. Пример композиционной схемы в терминах ЮЕР5 приведен на рис. 5,

шшшшшвшштшштшмтшшшт.\

оапл Проект

Рвцачср сгадаарс! Г^дамвске* rpttcratn^a \ Компсэщмсикя схена j Kfláosttj.kaíAmoí-MsncxsMa ] Сш-ч е^Ц^Цбссймй

-ТЗК

Злектрсонвргвткчвслив системы ÜtJTíbíbí гаэогнайжгчия Системы нвфге;иабжамия

С№«в(«ы у л««иа$жеии*

Участии

Разрезы

Обвгсп!гельные озЗрнкн У row-tu? 6-vsbi Сйётемы т«пясо<абягжя

системы

' 5 -

\

}

Уч.

да

/ ч

X лXхл

XJ

л

Проект: ехда>! ■Текуш^й кла:с: Ша.чтг| ;Xí'Í¿ W>.r ' ■■^SÜu -. '^-'.'-- '' ■ -v W: • Щ

Рис. 5. Пример таксономии ТЭК

Заключение. Можно довольно долго дискутировать по поводу достоинств и недостатков описанных средств и технологий. Однозначно можно сказать, что стандартизация описания знаний в области онтологий играет решающую роль на пути создания Semantic Web и, в лице OWL, предоставляет мощный инструмент, учитывающий и предоставляющий все возможности для применения наиболее грамотного подхода к описанию онтологий. Организация машины вывода и средств графического представления даст возможность выявления новых свойств предметной области уже в процессе ее создания, за счет наглядности и логического контроля.

Библиографический список

1. Овдей О.М., Проскудина Г.Ю. Обзор инструментов инженерии онтологий // Журнал Электронные Библиотеки // www.elbib,ru/index.phtml?page=elbib/rus/journal/2004/part4.

2. Манцивода A.B. Онтологии - дорога в будущее /

3. http://teacode.com/concept/eor/sp6.html.

4. Манцивода A.B. Семантический Интернет / http://teacode.com/concept/eor/sp2htmi.

5. Костюченко А,П. Построение онтологий для системных исследований в энергетике// Труды X Байкальской Всероссийской Конференции, Информационные и математические технологии в науке технике и образовании, - Иркутск, 2005, - Н. 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Верников Г.А, Обзор стандарта IDEF5. Описание стандарта онтологического моделирования IDEF5, //http://www.vpg, ru/main.mhtml?PublD=25.

О.М.Попова

Построение геоинформационной системы электрических сетей

В лаборатории проблем развития электроэнергетических систем ИСЭМ СО РАН разработана первая версия геоинформационной системы (ГИС) развивающихся электрических сетей. Она создана в увязке с оптимизационной моделью и предназначена для визуализации и анализа вариантов развития основной элек-

трической сети электроэнергетической системы (ЭЭС) [1-3]. В настоящее время разрабатывается вторая версия рассматриваемой системы, на рис. 1 показаны ее основные компоненты,

Работа программы ElectNet, связанной с Maplnfo по технологии OLE Automation, подробно рассмотрена

i Надоели баннеры? Вы всегда можете отключить рекламу.