УДК 004.6
ПОДХОД К ОРГАНИЗАЦИИ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ ПРИНЯТИЯ
РЕШЕНИЙ В СФЕРЕ ЭНЕРГЕТИКИ
РАТМАНОВА И.Д., канд. техн. наук
Рассматривается методика организации информационной поддержки принятия решений для стратегического менеджмента крупных систем энергетики, основой которой является информационно-аналитическая модель хранилища, поддерживающая функционирование средств информационного наполнения хранилища данных и аналитической обработки накопленной информации. Предлагаются модели и методы, разработанные с учетом особенностей больших систем энергетики.
Ключевые слова: менеджмент, интеграция данных, хранилище данных, информационно-аналитическая модель.
APPROACH TO THE ORGANIZATION OF DECISION-MAKING INFORMATION SUPPORT IN POWER ENGINEERING SPHERE
I.D. RATMANOVA, Ph.D.
The paper represents the method of decision-making information support organization for strategical management of large power engineering structures. The base of this organization is warehouse data-analytic model, which supports the work of data warehouse content means and analytical processing of stored information. The author suggests models and methods which were developed subject to the peculiarities of large power engineering structures.
Key words: management, data integration, data warehouse, data-analytic model.
Стратегический менеджмент крупных систем энергетики (федеральных и региональных компаний, энергетических комплексов, корпораций) невозможен без организации полноценной информационной поддержки. Получение эффективных и обоснованных решений, направленных на повышение надежности и экономичности функционирования систем, а также их развитие и совершенствование затрудняются многоас-пектностью решаемых задач, многосвязанно-стью исследуемых характеристик, нечеткостью и неоднозначностью критериев, неполнотой исходной информации. При этом характерными чертами крупных систем энергетики являются многоуровневая иерархическая структура, территориальная распределенность, большая размерность. Отсутствие формализованных подходов к принятию решений по совершенствованию систем энергетики обусловливает необходимость организации информационной поддержки принятия решений на основе мониторинга и оценки состояния исследуемых систем в рамках систем поддержки принятия решений (СППР).
Интеграция данных - основа СППР. Современный подход к автоматизации поддержки принятия решений основан на использовании концепции хранилищ данных корпоративных информационно-аналитических систем (ИАС). Хранилище данных обеспечивает интеграцию данных различных информационных источников для организации многоаспектной аналитической обработки в целях подготовки информации для
принятия решений. Можно выделить несколько характерных задач интеграции данных.
Мониторинг и оценка состояния объекта управления (задача контроллинга) [1].Целесообразен подход к управлению функционированием и развитием систем посредством организации контроллинга качества объектов и процессов, например, технического состояния, уровня эксплуатации электросетевого и станционного оборудования. Задача контроллинга как способа управления «от данных» подразумевает организацию мониторинга (в рамках оценочных критериев), оценку состояния (фиксацию отклонений от планов/нормативов), а также подготовку информации для принятия решений по стратегическому планированию. При этом информация о состоянии объекта управления, формируемая в основном системами оперативной обработки, преобразуется в совокупность соответствующим образом организованных оценочных показателей, из ретроспективы которых в результате аналитической обработки извлекаются данные для принятия решений. В процессе мониторинга выполняется идентификация объектов системы, определение альтернатив, их ранжирование с учетом значений соответствующих показателей на основе специализированных методик экспертной оценки с аддитивной сверткой значений показателей относительно заданного критерия.
Формирование шаблонов знаний из ретроспективы ведомственной статистики (задача индуктивного обучения). Накопленная в едином хранилище данных ретроспектива ведомственной (корпоративной) статистики подвергается исследованию методами интеллектуального анализа данных. При этом выполняется:
- выявление аномальных явлений (центров качества), диспропорций и точек роста (методами снижения размерности исследуемого признакового пространства, классификации объектов и признаков);
- исследование закономерностей (методами обнаружения логических закономерностей в данных, корреляционно-регрессионного анализа);
- прогностическое моделирование (методами статистического изучения динамики, ней-росетевого моделирования).
Характерными предметными приложениями для таких систем являются диагностика технического состояния энергетических объектов, учет технологических нарушений, ведение архивов проектных решений и др. Сформированные шаблоны знаний могут быть использованы в качестве моделей выбора альтернативных решений в экспертных компонентах САПР (задачи структурно-параметрического синтеза), классификационных и прогностических моделей, моделей лучших аналогов (задачи поддержания технического уровня проектируемых изделий, бен-чмаркинга в управлении качеством), бизнес-логики в задачах контроллинга и др.
Ведение ведомственных реестров; структурный анализ ретроспективы ведомственного учета (задача систематизации ведомственного учета). Кроме непосредственного использования, связанного с систематизацией ведомственного учета, реестр используется в качестве общесистемного справочника для согласования связанных с ним информационных ресурсов. Кроме того, реестр может использоваться в качестве направления консолидации при организации мониторинга состояния объектов управления. На его основе может быть организован количественный (структурный) анализ процессов, событийно связанных с субъектами реестра.
Важной особенностью организации ведомственного учета является поддержание в хранилище историчности регистрационных сведений. В сфере энергетики представляет интерес следующий регистрационный учет: паспортизация оборудования; реестр организаций топливно-энергетического комплекса (ТЭК); реестр потребителей энергоресурсов и др. При этом следует отметить важность организации нормативно-технических данных (НТД), используемых в процессе ведения реестров (данные справочников, ГОСТ, руководящих документов, номенклатур и др). Учитывая большую размерность данной задачи, многообразие структур нормативных документов, целесообразно применение инструмен-
тального подхода к ведению НТД на основе унифицированной модели данных [2].
В реальной практике чаще всего имеет место синтез перечисленных задач интеграции.
Комплексная информационно-
аналитическая модель СППР. Учитывая длительность жизненного цикла корпоративных ИАС, пересечение множества предметных областей (вертикалей), масштабность и сложность решаемых задач, территориальную распределенность объектов, наличие нескольких уровней иерархии управления, ориентацию на аналитическую обработку данных, целесообразно применение инструментальных средств организации СППР. В основе СППР лежит информационно-аналитическая модель хранилища данных, посредством которой осуществляется информационное обеспечение методов операционного окружения. К ним относятся методы организации информационного наполнения хранилища данных и методы организации аналитической обработки накопленной информации. Вся бизнес-логика СППР хранится на уровне метаданных хранилища и поддерживается соответствующими САБЕ-средствами инструментальной системы [3].
Наиболее распространенной моделью организации хранилищ является реляционная модель данных. Проектирование хранилища данных выполняется в терминах концептуальной модели (модели «сущность-связь»). Через интерфейс концептуальной модели осуществляется доступ к системным метаданным сервера баз данных (т.е. выполняется проектирование и реинжиниринг базы данных). С учетом многоаспектности и масштабности решаемых задач в энергетике концептуальная модель хранилища представляется множеством взаимосвязанных предметных областей. Каждую предметную область можно определить как совокупность сущностей, атрибутов и связей между ними. Следует отметить, что одна и та же сущность может входить в несколько предметных областей.
Сущности в предметной области связываются в структуры данных, которые определяют процессы интеграции данных, их извлечения и последующей аналитической обработки. Выделяются два основных варианта структур: агрегированные данные и детализированные данные. К агрегированным данным обычно относятся различные статистические сведения, совокупные отчетные данные за определенный период времени, своды по различным видам деятельности организации и т.п.
Концепцией хранения агрегированных данных для аналитических моделей можно считать технику многомерного моделирования предметной области (от англ. «Ртеп1юпа1 Modeling») [4]. Данная техника
получила свое развитие из классических концепций оформления баз данных для использования средствами OLAP в виде схем «звезда» (star schema).
Множество структур детализированных данных условно можно разделить на два подмножества: структуры для регистрации различных событий (событийной истории) и структуры для ведения реестров (история информационных объектов). События обычно регистрируются в транзакционных системах (системах оперативной обработки) - контроль энергоресурсопотребления, учет технологических нарушений, диагностика оборудования и т.д. Каждому такому событию соответствует момент его наступления, следовательно, при занесении записи о нем в базу данных фиксируется соответствующая дата. В централизованном хранилище для аналитической обработки накопленных событий целесообразно организовать соответствующую звездообразную структуру (реальную или виртуальную) для выполнения количественного многомерного анализа накопленной информации (используя функции SUM, AGG и др. в SQL).
Ведение ведомственных/корпоративных реестров основано на поддержании хронологического набора изменений сущностей. При этом ведется информация об объектах (организациях ТЭК, котельных, паспортах оборудования, сотрудниках и т.д.), которая со временем изменяется. Реестры могут также использоваться в качестве справочников измерений в звездообразных структурах данных. Кроме того, в хранилище для структурного анализа ретроспективы ведомственного учета возможно организовать аналитическую витрину (звездообразную структуру), используя в основном функцию COUNT языка SQL.
Концептуальная модель хранилища данных является основой описания комплексной информационно-аналитической модели СППР, посредством которой осуществляется взаимодействие операционного окружения СППР с хранилищем данных. Комплексная информационно-аналитическая модель включает множество многомерных и навигационных моделей, а также множество всех связей между ними. Посредством связей обеспечивается возможность эффективной работы с измерениями многомерных моделей, являющимися реестрами некоторой предметной области.
Многомерная информационная модель [5] позволяет извлекать из хранилища данных численную информацию в многомерном базисе измерений. Она чаще всего используется для доступа к агрегированной информации, представленной в хранилище звездообразными объектами, а также к накопленной ретроспективе регистрационных сведений. В последнем случае возможно использование модели «виртуальная звезда» [6].
В основе модели лежит понятие многомерного гиперкуба. Осями гиперкуба (атрибута-
ми модели) могут быть любые способы консолидации данных, представляемые справочниками экземпляров некоторых объектов (множеством точек оси). Совокупность выбранных экземпляров от каждой оси однозначно характеризует ячейку гиперкуба в пространстве объявленных атрибутов.
В многомерной информационной модели формально описаны правила получения значений, извлекаемых в процессе многомерного анализа хранилищ данных, для разных групп ячеек формируемого гиперкуба. При этом учтены следующие особенности, характерные для приложений в сфере энергетики:
1. Объединение в одной многомерной модели нескольких таблиц фактов (сложность системы с множеством объектов управления). Для разных экземпляров справочника одного уровня обобщения данных по некоторому измерению (атрибуту) правила получения значений показателей могут отличаться, например, по измерению «Вид оборудования» для разных экземпляров одного справочника (силовой трансформатор, измерительный трансформатор, воздушная линия электропередачи, выключатель и т.д.) будут использованы разные правила получения значений на основе соответствующих таблиц фактов.
2. Объединение в одной многомерной модели нескольких таблиц фактов (наличие в исследуемой системе нескольких уровней иерархии управления). Каждое измерение (атрибут) многомерной информационной модели может в каждом конкретном запросе быть представлено одним из возможных уровней обобщения данных, например, измерение «Объект ФСК» представляется следующими уровнями обобщения данных: «МЭС», «МЭС-ПМЭС», «МЭС-ПМЭС-Подстанция», «Подстанция».
3. Возможность в разных запросах к многомерной информационной модели выбирать разные подмножества существующих измерений (многоаспектность решаемых задач). При этом максимально полный гиперкуб показателей возникает только в случае выбора всех возможных измерений, в остальных случаях результат запроса будет представлен проекцией полного гиперкуба.
4. В рамках одной информационной модели совмещение значений показателей ячеек различной природы: значений полей численного типа; функций агрегирования SQL; формул (многоаспектность параметров и характеристик). Организуется мониторинг показателей разных видов (аддитивных, полуаддитивных и неаддитивных), например, показатель топливно-энергетического баланса «Производство тепловой энергии» суммируется в процессе движения по уровням обобщения («Организация ТЭК» -«Муниципальное образование»- «Область в
целом»); показатель «Удельный расход топлива на производство тепловой энергии» - усредняется.
5. Разделение множества экземпляров справочника уровня обобщения на непересекающиеся подмножества (территориальная распределенность систем энергетики). Для возможности задания отдельных правил извлечения значений показателей, например, по уровню обобщения «МЭС-ПМЭС-Подстанция» измерения «Объект ФСК» выделено три группы с соответствующими правилами извлечения значений.
Навигационная модель представляется в виде иерархии атрибутов концептуальной модели хранилища данных [7]. Каждый атрибут модели, принадлежащий сущности, описывается вектором свойств, включая вышестоящий атрибут в иерархии, тип связи с вышестоящим атрибутом (1:1,1:М,М:1,М:Ы), наименование атрибута, тип, таблицу в базе данных, соответствующее имя поля, первичный ключ соответствующей сущности и др. Данная модель является полииерархической, если существует множество потенциально корневых атрибутов «дерева» (атрибутов, которые могут быть использованы в качестве вершин иерархии). Навигация по хранилищу данных, описанному поли-иерархической моделью, заключается в последовательном переходе от одного атрибута к другому. Навигационные модели обычно используются для организации нерегла-ментированного поиска информации в ведомственных реестрах, а также при работе с многоуровневыми справочниками измерений в многомерных моделях данных.
Информационно-аналитическая модель хранилища используется методами организации информационного наполнения хранилища данных [8]. Масштабирование среды информационного наполнения хранилища данных обеспечивается посредством унификации формата представления структуры данных электронного источника; унификации запроса хранилища данных с целью переформулирования в языковую среду манипулирования данными системы хранения источника; унификации шаблонов форм для сбора детализированных и агрегированных данных на основе метаданных хранилища.
Для организации аналитической обработки накопленной в хранилище информации предлагается развить традиционный аналитический интерфейс [9] возможностью включения унифицированных методов проецирования сформированного по результатам запроса гиперкуба с целью подключения соответствующих методов аналитической обработки информации. При этом выделено три вида проецирования: «объект-свойство»; «показатель-время»; «многомерный факт».
Апробация предложенных подходов. Разработанная методология проектирования СППР использована при создании ряда корпоративных проектов в сфере энергетики [10,11]. Пользователями созданных ИАС являются спе-
циалисты региональных департаментов топливно-энергетических комплексов, региональных служб по тарифам, центров энергосбережения, федеральных и региональных энергетических компаний, подразделений Росэнер-гонадзора, информационных и экономических департаментов органов государственной власти и управления. Полученные результаты подтверждают работоспособность и эффективность разработанных подходов.
Список литературы
1. Ратманова И.Д. Организация контроллинга качества в среде поддержки принятия решений // Вестник ИГЭУ. - 2006. -Вып. 3. - С. 71-79.
2. Технология проектирования тепловых электростанций и способы ее компьютеризации / Н.Б. Ильичев, Б.М. Ларин, А.В. Мошкарин и др.; Под ред. В.Н. Нуждина, А.В. Мошкарина. - М.: Энергоатомиздат, 1997.
3. Программный комплекс ИнфоВизор как среда поддержания жизненного цикла корпоративных информационных систем / С.Д. Коровкин, И.А. Левенец, И.Д. Ратманова, Л.В. Щавелев // Вестник ИГЭУ. - Иваново, 2004. - Вып. 3. - С. 71-79.
4. Kimball R. A Dimentional Modeling Manifesto // DBMS. - 1997. - № 8.
5. Решение проблемы комплексного оперативного анализа информации хранилищ данных / С.Д. Коровкин, И.А. Левенец, И.Д. Ратманова и др. // СУБД. - 1997. -№ 5-6. - С. 47-51.
6. Щавелев Л.В. Способы аналитической обработки данных для поддержки принятия решений // СУБД. - 1998. - № 4-5. -С. 51-60.
7. Левенец И.А., Ратманова И.Д., Ща-велев Л.В. Поли-иерархическая модель представления реляционной структуры хранилищ данных // Новые информационные технологии: Мат-лы науч.-практ. семинара / Моск. гос. ин-т электроники и математики. -М., 1998. - С. 49-56.
8. Ратманова И.Д., Павлов М.Н. Подход к организации средств интеграции данных в корпоративных информационно-аналитических системах // Информационные технологии. - 2006. - № 6. - С. 2-17.
9. Codd E.F., Codd S.B., Salley C.T. Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Mandate. - E. F. Codd & Associates, 1993.
10. Ратманова И.Д., Савельев В.А. О создании корпоративной информационно-аналитической системы по оценке технического состояния и условий эксплуатации электросетевого оборудования ОАО «ФСК ЕЭС» // Вестник ИГЭУ. - 2003. - №5. - С.90-93.
11. Система ведения топливно-энергетического баланса как среда для поддержки принятия решений по управлению топливно-энергетическим комплексом региона /
С.Д. Коровкин, И.Д. Ратманова, Л.В. Щаве-лев, И.А. Левенец // Вестник ИГЭУ. - 2005. -№ 4. - С. 60-63.
Ратманова Ирина Дмитриевна,
ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина», кандидат технических наук, доцент, заместитель директора информационно-вычислительного центра, телефон (4932) 26-98-34, e-mail: idr@osi.ispu.ru