СПОСОБЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В СЛОЖНЫХ СИСТЕМАХ

Кравченко Юрий Алексеевич; Лежебоков Андрей Анатольевич; Запорожец Дмитрий Юрьевич

Известия Кабардино-Балкарского научного центра РАН № 3 (47) 2012

ИНФОРМАТИКА. НАНОТЕХНОЛОГИИ

УДК 002.53:004.89

СПОСОБЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В СЛОЖНЫХ СИСТЕМАХ

Ю.А. КРАВЧЕНКО, А.А. ЛЕЖЕБОКОВ, Д.Ю. ЗАПОРОЖЕЦ

ФГАОУ ВПО Южный федеральный университет Технологический институт в г. Таганроге 347928, г. Таганрог, пер. Некрасовский, 44, ГСП-17А E-mail: rector@tti. sfedu.ru

В статье приведена информация об использовании MDX-запросов при интеллектуальном анализе данных для задач принятия решений и об использовании аппарата имитационного моделирования сетей Петри при интеллектуальном анализе данных для задач принятия решений в сложных динамических системах. Рассматриваются преимущества использования имитационных моделей при анализе априорной информации о состоянии сложного объекта и динамики его развития в условиях воздействия факторов внешней среды. Рассмотрен абстрактный пример функционирования сети Петри на трех множествах априорной информации. Описаны перспективы применения данного подхода для представления и извлечения знаний из различных предметных областей.

Ключевые слова: принятие решений, неопределенность, извлечение знаний, имитационное моделирование, интеллектуальный анализ данных.

Введение

Объектом данной работы являются анализ технологии OLAP, построение многомерных структур обработки данных и запросов к ним на языке MDX. OLAP (online analytical processing) - технология обработки информации, включающая составление и динамическую публикацию отчётов и документов для аналитиков. MDX (multidimensional expressions) - язык многомерных запросов для работы с кубами [1].

В случае экстраполяции свойств современных сложных объектов проверка условия достоверности оказывается настолько проблематичной, что вынуждает идти по пути использования математических моделей, которые могут быть воплощены в программном обеспечении испытательных комплексов. Применение математической модели позволяет широко использовать возможности ЭВМ в контуре контроля и управления при проверке сложного объекта. Суть контроля заключается в сравнении состояний сложного объекта и модели после отработки каждого управляющего воздействия в соответствии с программой испытаний.

Сложность объектов не позволяет строить для них абсолютно адекватные модели. Математическая модель, будучи формализованным абстрактным описанием объекта, в состоянии охватить только основные, характерные его свойства, оставляя в стороне несущественные факторы.

1. Возможности языка MDX запросов Актуальность OLAP-технологий обусловлена их практической значимостью для анализа больших объемов данных. Основные особенности OLAP:

- работает с многомерными структурами;

- получает информацию об аномалиях, закономерностях и трендах в базе данных без выяснения смыслового значения данных;

- обеспечивает быстрый доступ к результатам;

- использует заранее рассчитанные сводные данные;

- позволяет использовать различную агрегацию данных на каждом из уровней разбора запроса MDX;

- дает возможность отображать N-мерные срезы;

- позволяет получить необходимую нам информацию, не вдаваясь в подробности способа выдачи этой информации из базы данных [2].

В ходе исследования OLAP-технологии выделены основные этапы аналитического процесса.

1. Определение списка возможных запросов аналитика. Данная информация может быть получена непосредственно от аналитика либо выяснена путем общего анализа базы данных на предмет фактов и их зависимостей.

2. Анализ структуры базы данных и выборка необходимого и достаточного набора измерений и мер. Данный этап производится по информации из списка запросов аналитика. На основании этой информации строится представление базы данных, в которое включены только те таблицы и именованные запросы, которые содержат информацию, необходимую аналитику для построения отчетов. Сложность его построения напрямую зависит от степени денормализации исходной базы. Использование представления позволяет повысить безопасность системы, поскольку не происходит прямое обращение к исходной базе.

3. Создание многомерной структуры на основе полученного набора. Данный этап производится с использованием специального инструментария (в данном случае использовалась Business Intelligence Studio 2005). OLAP куб содержит информацию о способе группировки данных представления.

4. Выполнение запросов, построение отчетов, сбор статистической информации. Данный этап является финальным в аналитическом процессе. Для получения информации используется язык многомерных запросов MDX с возможностью различного агрегирования данных по различным созданным измерениям.

2. Разработка имитационной модели анализа данных

В работе рассматривается взаимодействие внутренних моделей компонентов интеллектуальных информационных систем с помощью аппарата сетей Петри. Модели компонентов создаются на основе комбинации свойств интеллектуальных агентов. Каждый агент имеет механизм обработки входящих и исходящих сообщений, получения данных из входящих сообщений и преобразования исходящей информации в единый заданный формат.

Моделирование в сетях Петри осуществляется на событийном уровне. Определяются, какие действия происходят в подсистеме, какие состояния предшествовали этим действиям и какие состояния примет подсистема после выполнения действия. Выполнение событийной модели в сетях Петри описывает поведение подсистемы. Анализируя результаты выполнения, можно сказать о том, в каких состояниях пребывала или не пребывала подсистема, какие состояния в принципе не достижимы.

3. Моделирование на основе сетей Петри

Сеть Петри определяется как четверка <Р, Т, I, O>, где Р и Т - конечные множества позиций и переходов, I и O - множества входных и выходных функций. Другими словами, сеть Петри представляет собой двудольный ориентированный граф, в котором позициям Р соответствуют вершины, изображаемые кружками, а переходам Т - вершины, изображаемые утолщенными черточками; функциям I соответствуют дуги, направленные от позиций к переходам, а функциям О - дуги, направленные от переходов к позициям [3].

В сетях Петри вводятся объекты двух типов: динамические, которые изображаются метками (маркерами) внутри позиций, и статические, которые соответствуют вершинам сети Петри.

Маркировка - распределение маркеров по позициям. Маркеры могут перемещаться в сети. Каждое изменение маркировки называют событием, причем каждое событие связано с определенным переходом. События происходят мгновенно и разновременно при выполнении некоторых условий.

Каждому условию в сети Петри соответствует определенная позиция. Совершению события соответствует срабатывание перехода, при котором маркеры из входных позиций этого перехода перемещаются в выходные позиции. Последовательность событий образует моделируемый процесс [3].

В рассматриваемом случае начальными условиями для имитационной модели функционирования сложной системы будут служить три множества (рис. 1):

1) С - множество воздействий внешней среды;

2) А - множество внутренних характеристик системы;

3) А1 - множество управляющих воздействий на систему.

Предложим возможный вариант состава элементов данных множеств, мощности множеств выберем случайным образом, реализуя тем самым абстрактный пример функционирования сети. Множество С = {с1,с2,с3,с4,с5,с6,с^т}, где с1-с6- информация о возможных воздействиях внешней среды, с2его - вершина, необходимая теоретически для моделирования ситуации полного отсутствия выделенных воздействий, метка в ней появится только в том случае, если будут отсутствовать метки во всех остальных вершинах множества С.

Для учета всех возможных комбинаций наличия составляющих воздействия внешней среды в данном абстрактном примере необходимо создать 26 переходов. Причем дисциплина обслуживания переходов должна быть с абсолютным приоритетом в зависимости от количества входящих в переход дуг. С увеличением количества входящих в переход дуг его приоритет должен возрастать. Это необходимо для разрешения конфликтных ситуаций в пользу событий, фиксирующих наличие большего числа выделенных составляющих внешних воздействий.

Таким образом, открывшись, переход г = 1,26 отправит информацию о наличии составляющих воздействий внешней среды в вершину классификатора ВК1, наличие метки в которой позволит открыть переход tm+2 и передать полученные сведения в модуль принятия решения МПР (рис. 1).

С другой стороны, на принятие решений по управлению системой будет влиять комбинация меток в вершинах множества A={a1,a2,a3,a4}, описывающих множество внутренних параметров системы. Причем в этом множестве необходимо учитывать как наличие отдельных характеристик, так и их комбинации, т.к. могут существовать недопустимые соотношения параметров управляемого сложного объекта. Определение допустимых наборов параметров управляемой системы происходит посредством передачи маркеров через переходы 4, п = г +1,г + 2 к вершинам ПС1 или ПС2, моделирующих выборки допустимых параметров системы. В дальнейшем эта информация попадет в вершину классификатора ВК2 и далее к модулю принятия решения.

Подобным образом комбинация меток в вершинах множества А1 = {а11, а12, а13, а14, а15, а16} описывает допустимые наборы управляющих воздействий на систему посредством передачи маркеров через переходы tm, т=п +1, п + 4 к вершинам УВ1, УВ2, УВ3, УВ4. В дальнейшем эта информация попадет в вершину классификатора ВК3 и далее к модулю принятия решения МПР (рис. 1).

Рис. 1. Абстрактный пример работы имитационной модели с выполнением условия достижимости сети

4. Анализ априорной информации на основе имитационной модели

Покажем работу имитационной модели с выполнением условия достижимости, в качестве априорной информации будем использовать начальные условия, представленные на рис. 1.

В данном случае начальные условия позволяют в ходе работы сети определить допустимое множество внутренних параметров системы (переход tn, вершина ПС2), допустимое множество управляющих воздействий (переход вершина УВ3), параметры воздействия внешней среды (переход t¡, вершина ВК}). Это позволяет через вершины ВК}, ВК2, ВК3 открыть переходы Тт+1, Тт+2, Тт+3.

Результатом работы сети являются передвижение трех маркеров в вершину модуля принятия решения (МПР) и выработка им рекомендаций по возможным корректировкам управляющих воздействий. Дальнейшая возможность открытия виртуального перехода tq позволяет сделать вывод о достижимости сети, что подтверждает решение задачи.

Покажем теперь работу модели на абстрактном примере, иллюстрирующем нарушение условия достижимости сети (рис. 2). В данном случае начальные условия позволяют в ходе работы сети определить допустимое множество управляющих воздействий (переход ^+1, вершина УВД параметры воздействия внешней среды (переход t2, вершина ВК}), но допустимое множество параметров системы не установлено, так как в вершину ВК2 не переместился ни один маркер. Это произошло из-за того, что параметры системы, соответствующие вершинам а} и а2, не являются допустимой комбинацией.

Результатом работы сети является передвижение только двух маркеров в вершину модуля принятия решения. Поэтому виртуальный переход tq не будет открыт, что позволяет сделать вывод о невозможности решения поставленной задачи. Корректировка управ-

ляющих воздействий на систему в данном случае будет проводиться экспертом на основе дополнительной оценки оперативной ситуации.

Рис. 2. Абстрактный пример работы имитационной модели с нарушением условия достижимости сети

Заключение

Рассмотренный в статье подход имитационного моделирования принятия решений в интеллектуальных информационных системах использует интегрированный метод представления знаний. Это позволяет применять в исследованиях параметры из различных предметных областей для решения важных задач извлечения и обработки знаний. Подобная интеграция позволит оперативно отслеживать изменения в динамике развития системы и корректировать управляющие воздействия при изменении начальных условий.

Использование формальных методов (например, сетей Петри) для синтеза знаний с корректным содержанием может стать основой методов создания интеллектуальных информационных систем. Методы анализа воздействий внешней среды, множеств параметров системы и управляющих функций с использованием дерева достижимости и матричной теории сетей Петри позволят формализовать многие процессы, обладающие некоторой степенью неопределенности.

ЛИТЕРАТУРА

1. Эндрю Дж. Браст, Стивен Форте. Разработка приложений на основе Microsoft SQL Server 2005. Мастер-класс / Пер. с англ. М.: Издательство «Русская Редакция», 2007.

2. Бергер А. Microsoft SQL Server Analysis Services, OLAP и многомерный анализ данных. СПб.: Издательство «БХВ-Петербург», 2007.

3. Норенков И.П., Кузьмик П.К. Информационная поддержка наукоемких изделий. CALS-технологии. М.: Изд-во МГТУ им. Н.Э. Баумана, 2002.

4. Nelson G. and J. Wright. Real Time Decision Support: Creating a Flexible Architecture for Real Time Analytics. DSSResources.COM, 11.18.2005.

METHODS OF INTELLIGENT DATA ANALYSIS IN COMPLEX SYSTEMS

Y.A. KRAVCHENKO, A.A. LEZHEBOKOV, D.Y. ZAPOROZHETS

Southern Federal University, Technological Institute at Taganrog 347928, Taganrog, 44, Nekrasovsky Lane, GSP-17A E-mail: rector@tti.sfedu.ru

This article contains information about application of MDX requests for the intellectual data analysis for support of decision-making and about using the simulation Petri nets at intellectual analysis for decision-making problems in complex dynamic systems. The advantages of simulation models in the analysis of a priori information about the state of a complex object and the dynamics of its development under the impact of environmental factors were described. We considered an abstract example of a network function on the three sets a priori information. We described the prospects of applying this approach to representation and extraction knowledge from different subject areas.

Key words: decision-making, uncertainty, knowledge extraction, simulation modeling, intelligent data analysis.

Работа поступила 20. 05. 2012 г.

СПОСОБЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В СЛОЖНЫХ СИСТЕМАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

Текст научной работы на тему «СПОСОБЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В СЛОЖНЫХ СИСТЕМАХ»