Научная статья на тему 'Методы представления данных для использования в распределенных информационных системах на основе онтологий'

Методы представления данных для использования в распределенных информационных системах на основе онтологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
116
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕМАНТИЧЕСКАЯ МОДЕЛЬ / РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ / АВТОМАТИЗИРОВАННАЯ СИСТЕМА ДИСПЕТЧЕРСКОГО УПРАВЛЕНИЯ / ОНТОЛОГИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гвоздевский И.Н.

В настоящее время большое значение имеют информационные системы, используемые для мониторинга, диагностики и управления различными критическими элементами инфраструктуры современных предприятий и структур жизнеобеспечения. Зачастую системы представляют собой сложные взаимосвязанные комбинации подсистем, которые решают совместные задачи управления. Такие многоуровневые системы могут быстро передавать критически важные данные, необходимые для принятия решения оператору автоматизированного комплекса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гвоздевский И.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы представления данных для использования в распределенных информационных системах на основе онтологий»

DOI: 10.12737/article_58e6133884f473.40648077

Гвоздевский И.Н., аспирант Белгородский государственный технологический университет им. В.Г. Шухова

МЕТОДЫ ПРЕДСТАВЛЕНИЯ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ В РАСПРЕДЕЛЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ НА ОСНОВЕ ОНТОЛОГИЙ

igorek@intbel.ru

В настоящее время большое значение имеют информационные системы, используемые для мониторинга, диагностики и управления различными критическими элементами инфраструктуры современных предприятий и структур жизнеобеспечения. Зачастую системы представляют собой сложные взаимосвязанные комбинации подсистем, которые решают совместные задачи управления. Такие многоуровневые системы могут быстро передавать критически важные данные, необходимые для принятия решения оператору автоматизированного комплекса.

Ключевые слова: семантическая модель, распределенные вычислительные системы, автоматизированная система диспетчерского управления, онтология.

Введение. Разнообразие элементной базы, программного обеспечения, протоколов взаимодействия на ключевых уровнях позволяет говорить о решении проблем оптимизации внутренних структур и подходов к хранению и обработке наборов данных, которые в интерактивном режиме доставляются оператору или комплексной системе мониторинга. Характерной особенностью работы таких систем является отзывчивость реакции на событие, поэтому входящие данные должны быть представлены в наиболее удобной форме, что позволит использовать их любыми элементами, входящими в современную автоматизированную систему диспетчерского управления.

Методология. В информационной системе онтология может быть сформирована для выполнения различных задач, в том числе на разных уровнях функционирования среды. Высший уровень онтологий при использовании классификации для задачи является наиболее общим и помогает реализовать концептуализацию формализмов представления знаний (онтология представления). Онтологией верхнего уровня можно считать следующим шагом в детализации онтологической модели. Дальнейшая консолидация онтологии позволяет создать онтологию определенной предметной области, используемую для решения любых проблем определенной области знаний. Более низкий уровень классифицируется как прикладная онтология, которая позволяет выполнять определенную узко специализированную задачу.

Основная часть. Поскольку подсистемы, которые являются частью распределенной автоматизированной системы, в основном самодостаточны, используемые в них данные имеют структурированный вид и представляют собой поток событий, записанных в файле или базе

данных. В результате расширения числа подсистем в процессе эксплуатации растет число элементов, необходимых для поддержки формирования, регистрации и интерпретации этих потоков.

При использовании географически распределенных сложных систем, к которым может быть отнесена рассматриваемая автоматизированная система диспетчерского управления, необходимо учитывать ряд факторов, влияющих на оперативность реакции системы, унификацию средств управления для формирования управляющего потока событий, создание общего Хранилища данных, способные обеспечить возможность анализа сущности происходящих процессов, системы в целом и ее отдельных элементов.

Для решения проблем в информационной среде онтологии также могут быть классифицированы в соответствии с их содержанием на рис. 1. Это позволяет акцентировать внимание на содержании базы знаний, а не на общей формализованной модели абстрактных понятий. На верхнем уровне можно описать основные понятия, абстрагированные от предметной области, такой концепцией может быть время, объекты, событие, действие.

Ориентированная онтология (онтология среднего уровня) позволяет использовать ее при реализации прикладного программного обеспечения для выполнения конкретной задачи. Часто онтологии [4] заданного уровня содержат конкретные понятия и элементы, присущие только данной предметной области, но также можно хранить общие понятия. Ориентированная онтология содержит терминологию, представленную в онтологиях верхнего уровня, по наследству. Онтология [3] субъекта (онтология нижнего уровня) содержит описательную часть конкрет-

ного объекта, участвующего в конкретной дея- дробные характеристики конечного объекта и тельности. Эта онтология позволяет указать по- методы взаимодействия.

Рис. 1. Общий вид частиц отходов ММС

К основным методам определения онтоло-гий в настоящее время можно отнести следующие подходы:

• Наборы;

• Графический подход;

• Автоматизированный подход;

• Описательная логика.

При использовании множеств онтология определяется как набор определений (понятий) домена, отношений между понятиями и набора функций для интерпретации понятий по множеству отношений. Этот подход является более абстрактным, что повышает гибкость приложения и очень похоже на подход к дескриптивной логике [3]. При создании модели, описывающей предметную область, основной проблемой является сложность используемой алгебры множеств. Также нет встроенных методов для тестирования онтологии и выборки данных, реализация которых является сложной и зависит от конкретной модели.

При определении онтологии с использованием графового подхода основным преимуществом является ясность, которая облегчает понимание модели для широкого круга людей, не обладающих специальными навыками, а также структурируемость информации. Онтология в этом случае представляется в виде ориентированного графа с циклами. Понятия - это вершины, а дуги графа соответствуют отношениям между определениями. Обширный математический аппарат теории графов позволяет использовать различные методы исследования с помощью эффективных алгоритмов, но он затрудняет унификацию и стандартизацию представлений, поскольку он не является ограничительной логикой для онтологии.

Реализация задачи описания онтологии возможна с помощью конечного автомата, что позволяет применять соответствующий концептуальный и математический аппарат. Этот под-

ход не позволяет подробно описать иерархии, описанные в онтологии. Например: если мы представляем онтологию в виде ориентированного графа

О = (К, Я) (1)

где К - множество предметных областей, а Я - множество бинарных отношений между К, то детерминированному автомату можно поставить в соответствие такой граф.

А = (К, Б, М, Е, Б (к, г)) (2)

где N - начальное состояние автомата, D -входной алфавит, М - множество состояний автомата, Е - конечное состояние автомата, Б (к, г) - множество переходных функций. Представление онтологий в виде конечных автоматов имеет возможность использовать операции пересечения, объединения, итерации, умножения нескольких автоматов, а также соответствующие алгебраические свойства формальных языков с помощью регулярных множеств. Основные недостатки этого подхода можно объяснить отсутствием полноты онтологических описаний [2], невозможностью однозначной интерпретации понятий и предметных областей в целом, сложности идентификации понятий и объектов на разных уровнях онтологии.

Адаптивный подход (дескриптивная логика) задачи онтологии основан на соответствующих инструментах логики предикатов первого порядка, семантических сетях и фреймах. Основные понятия этого подхода - унарные (элементарные понятия) и бинарные (элементарные роли) предикаты, используемые для определения отношений. Такой подход позволил нам сравнить операции с элементарными понятиями с определенными логическими операциями.

Одним из направлений использования он-тологий является применение моделей в автоматизированных системах диспетчеризации для

распределенных объектов жизнеобеспечения. Данная система представляет собой [1] сложную систему, имеющую многоуровневую структуру. Главной особенностью таких систем является возможность мониторинга и управления распределенными объектами в реальном времени [5]. Современные автоматизированные системы диспетчерского управления являются многоуровневыми системами, которые позволяют функционировать и обеспечивать регулирование процессов в случае критических ситуаций.

Многослойная система диспетчеризации (рис. 2) обеспечивается с помощью локальных систем управления [1] (системы электропитания,

тепловые пункты, системы приточно-вытяжной вентиляции), приводы (электромагнитные клапаны, насосы) на более низком уровне взаимодействия. Промежуточный технологический уровень коммуникационного оборудования, включая программные контроллеры, интерфейсные преобразователи, позволяет формировать пакеты управляющей и системной информации. Взаимодействие с верхним прикладным уровнем (базами данных, рабочими станциями пользователей, веб-серверами, серверами резервных технологий) осуществляется через транзитный уровень сетевого оборудования.

Технологиче

уровень

Тепловые пункты Системы энергоснабжения Вытяжные установки

Промежуточ ный уровень

Контроллеры

Преобразователи интерфейсов

Транзитный уровень

Сетевое оборудование Пограничные маршрутизаторы Сетевые системы защиты

• Клиентские приложения

• БСЛВЛ системы

• Веб сервера

• Базы данных

Прикладной уровень

Рис. 2. Иерархическая модель работы АСДУ

При создании онтологии нижнего (рис. 3) технологического уровня, очень важно провести детальную классификацию систем и оборудования, а также определить связь по принципу объект - функционал - система.

Используя разработанные модели для обеспечения функционирования распределенной компьютерной сети, были рассмотрены основные способы хранения и взаимодействия с онто-логиями [3], которые должны обеспечить высокую эффективность и показатели производительности. Чтобы хранить такие структуры, должны быть сформулированы механизмы, помимо информационного объекта, иметь возможность коррелировать данные и набор метаданных, описывающих классы и их свойства, а так-

же взаимосвязи между ними. В настоящее время существует несколько направлений для реализации онтологических хранилищ [4]:

• представлять в виде плоской модели;

• отображение онтологии в SQL-подобную модель базы данных;

• прикладное реляционное хранилище rdf-триплетов, owl репозиторий.

Для взаимодействия с разработанной моделью был проведен эксперимент, в котором предварительно сформированная структура онтологии одного из уровней модели работы модели автоматизированной системы диспетчеризации была загружена в соответствующие типы онтологических хранилищ. Время загрузки триплетов в различных моделях хранения (табл. 1.).

Таблица 1

Загрузка данных в онтологическую модель хранилища распределенной системы

Количество загруженных триплетов Время выполнения запроса, тип хранилища, сек

Плоская модель Jena TDB Jena SDB In-mem Sesame GraphDB MySQL

100K 0,587 0,208 6,481 0,693 9,024 6,362 1,012

500K 17,721 5,083 81,187 7,302 121,739 93,23 3,144

1M 67,297 38,667 321,836 64,891 588,342 387,6 7,673

5M 143,944 110,093 788,779 123,03 1540,75 960,8 38,57

10M 326,2658 215,059 1544,590 232,66 3290,80 2098 77,555

50M 672 426,730 2900,563 473,74 6888,06 3988 354,142

100M 3713,299 2368,35 15342,95 2672,9 49301,3 20408,5 703,712

Рис. 3. Структура онтологии технологического уровня.

При разработке моделей онтологий уровней можно выделить следующие объекты:

• System_index - иерархическая структура, описывающая состав соответствующего уровня, свойств, типов объектов и их состояний;

• System_cases - иерархическая структура, которая позволяет устанавливать прецеденты для соответствующего уровня;

• System_descгipton - иерархическая структура, взаимодействие с системами управления, мониторинг агентов и систем.

Выводы. Для реализации взаимодействия между уровнями абстракции автоматической системы диспетчерского управления, а также различных разрозненных информационных и

технологических систем, использование моделей онтологий и семантических структур, которые описывают свойства, базовую функциональность отдельных узлов, их состояние и способность предоставить информацию об ответе системы или узла на отказ, показывают их эффективность. Для этого каждый уровень выделяется в виде отдельной онтологии, представленной в формате owl / rdf, для удобства агентов соответствующего уровня. Эффективность подхода связана с детальной классификацией систем и оборудования, а также с определением механизмов коммуникации на основе принципа объектно-функциональной системы.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Белоусов А.В., Глаголев С.Н., Быстров А.Б., Кошлич Ю.А. Демонстрационная зона для энергосбережения БГТУ. В.Г. Шухова - база для разработки энергосберегающих проектов в регионе // Энергосбережение. Энергетика. Энергоаудит. № 10 (116). С. 10-17

2. Слободюк А.А., Маторин С.И., Четвериков С.Н. О подходе к созданию онтологий на основе системно-объектных моделей предметной области // Научные бюллетени Белгородского государственного университета. Серия: Экономика. Информатика. 2013. Т. 28. № 22-1 (165). С.186-194

3. Amann B., Fundulaki I., Scholl M. Интеграция онтологий и тезаурусов для создания схемы RDF и запросов к метаданным // Международный журнал по цифровым библиотекам. 2000. Т. 3. № 3. С. 221-236.

4. Симмонс Р. Семантические сети: их вычисление и использование для понимания английских предложений в «Компьютерных моделях мысли и языка», Schank R., Colby C. (ред.), Сан-Франциско. 1973 г.

5. Поляков В.М., Буханов Д.Г. Метод выбора расположения элементов контроля в распределенных системах диагностирования на основе кластерного анализа // Теория и практика системного анализа: сборник трудов Всерос. мо-лодеж. конф., Белгород, 1-3 октября 2012, г. Белгород: ИД «Белгород», 2012. C. 46-49.

6. Поляков В.М., Буханов Д.Г., Синюк В.Г. Базовые структурные модели распределенных вычислительных систем в многоагентной диагностической среде // Журнал «Информационные системы и технологии». 2012. №4(72). С.

52-56

7. Слободюк А.А. Расширенная классификация фактов, извлекаемых из УФО-модели в целях построения онтологии предметной области // Шестая международная научно-техническая конференция «Инфокоммуникаци-онные технологии в науке, производстве и образовании» (Инфоком-6): сборник научных трудов, Ставрополь, 21-27 апреля 2014, г. Ставрополь: Северо-Кавказский федеральный университет, 2014. C. 404-406

8. Семерханов И.А., Муромцев Д.И. Интеграция информационных систем на основе связанных данных // Научно-технический вестник информационных технологий, механики и оптики. 2013. № 5 (87). С. 123-127.

9. Кондратенко А.А., Маторин С.И. Логический вывод на визуальных графоаналитических УФО-моделях путем интеграции со средствами онтологического инжиниринга // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 2016. №9 (230) С. 156-164.

10. Цвелик Е.А. Метод построения иерархии критериев на основе онтологического анализа системы // ИВД. 2013. №4 (27) С.66.

11. Использование онтологий в системах на базе Jena [Электронный ресурс]. Систем. требования: Веб-браузер. URL: http://j ena.apache.org/documentation/ontology/ (дата обращения: 11.03.2017).

12. Спецификация языка RDF. W3C: Resource Description Framework (RDF). [Электронный ресурс]. Систем. требования: Веб-браузер. URL: http://www.w3.org/RDF/ (дата обращения: 27.02.2017).

Gvozdevskiy I.N.

METHODS OF PRESENTATION OF DATA FOR USE IN DISTRIBUTED INFORMATION SYSTEMS BASED ON ONTOLOGY

Currently, information systems used for monitoring, diagnosis and management of various critical elements of the infrastructure of modern enterprises and life support structures are of great importance. Often, systems are complex interrelated combinations of subsystems that solve joint management tasks. Such multi-tiered systems can quickly transfer the critical data needed to make a decision to the operator of an automated complex The variety of element base, software, protocols of interaction at key levels allows to talk about solving problems of optimization of internal structures and approaches to storage and processing of data sets that are delivered online to the operator or complex monitoring system.

Key words: semantic model, distributed computing systems, automated dispatch control system, ontology.

Гвоздевский Игорь Николаевич, аспирант кафедры программного обеспечения вычислительной техники и автоматизированных систем.

Белгородский государственный технологический университет им. В.Г. Шухова. Адрес: Россия, 308012, Белгород, ул. Костюкова, д. 46. E-mail: igorek@intbel.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.