Научная статья на тему 'Построение управляемых комплексов OLAP-моделей'

Построение управляемых комплексов OLAP-моделей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
245
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
OLAP-МОДЕЛЬ / КОМПЛЕКС OLAP-МОДЕЛЕЙ / УПРАВЛЕНИЕ / МНОГОМЕРНЫЕ ДАННЫЕ / ГИБРИДНАЯ МОДЕЛЬ ЗНАНИЙ / АЛГОРИТМЫ УПРАВЛЕНИЯ РАСЧЕТАМИ / OLAP-MODEL / OLAP-MODEL COMPLEX / CONTROL / MULTIDIMENSIONAL DATA / HYBRID KNOWLEDGE MODEL / CONTROL CALCULATION ALGORITHMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ноженков А. И.

Представлены средства метаописания комплексов OLAP-моделей для решения сложных аналитических задач. Описаны алгоритмы управления расчетами. Полученные результаты применены в задачах территориального планирования медицинской помощи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OLAP-MODELS CONTROLLED COMPLEX CONSTRUCTION

OLAP-models complex meta-description means for solving complicated analytical problems are presented. Control calculation algorithms are described. The results were applied for territorial planning of medical assistance.

Текст научной работы на тему «Построение управляемых комплексов OLAP-моделей»

A. V. Korobko, T. G. Penkova

METHOD OF CONCEPTUAL OLAP-MODELLING BASED ON FORMAL CONCEPTUAL ANALYSIS

A method of domain conceptual OLAP-modeling is suggested. The way of constructing the integral analytical model as a formal conceptual OLAP-cubes lattice is formally described. Advantages of on-line analytical processing based on conceptual OLAP-model are presented. Suggested method is implemented for integral analytical model constructing for scientific activities of the organization.

Keywords: conceptual OLAP-modeling, on-line analytical processing, formal conceptual analysis, decision support.

© Коробко А. В., Пенькова Т. Г., 2010

УДК004.04:004.421

А. И. Ноженков

ПОСТРОЕНИЕ УПРАВЛЯЕМЫХ КОМПЛЕКСОВ 0LAP-М0ДЕЛЕЙ*

Представлены средства метаописания комплексов OLAP-моделей для решения сложных аналитических задач. Описаны алгоритмы управления расчетами. Полученные результаты применены в задачах территориального планирования медицинской помощи.

Ключевые слова: OLAP-модель, комплекс OLAP-моделей, управление, многомерные данные, гибридная модель знаний, алгоритмы управления расчетами.

На сегодняшний день существует достаточно большое количество программных продуктов, реализующих функции OLAP-анализа. Такие крупные компании, как Hyperion Solutions Corp., IBM, Oracle, Microsoft, Sybase, Panorama Software, Cognos Inc. и другие ведут разработки в этой области, их решения охватывают практически все существующие задачи. Однако традиционные OLAP-решения малоэффективны в прикладных областях организационного управления, где необходим комплексный анализ данных, связанный с реализацией сложных аналитических алгоритмов. Методы расчета аналитических показателей для решения задач оперативного управления и планирования в здравоохранении, образовании, в сфере социальной защиты населения и множестве других прикладных областей представляют собой сложные многошаговые процессы анализа многомерных данных. Потребовался новый подход в OLAP-технологии, ориентированный на решение сложных аналитических задач, использующих связные многошаговые расчеты с множеством информационных объектов.

В статье представлены результаты работ по развитию функциональности OLAP-продуктов в рамках нового подхода, названного комплексным OLAP-моделированием [1; 2]. Описаны средства автоматизации разработки OLAP-приложений для сложных аналитических задач на основе построения управляемых комплексов OLAP-моделей.

Метаописание комплекса OLAP-моделей для сложных задач. Идея технологии ОЬАР хорошо описана [3-5]. В основе ОЬАР лежит многомерная логическая модель данных [6]. ОЬАР-модель (далее - модель) представляет собой описание процессов расчета некоторой аналитической задачи. Структурно аналитическая модель состоит из исходных данных (витрины данных), информационного куба и операций над ним, а также способов представления результатов вычисления.

Для решения сложных аналитических задач обычно строится не одна модель, а целый комплекс ОЬАР-моделей, каждая из которых решает отдельную подзадачу. Например, чтобы применить эту технологию к задаче планирования медицинской помощи, требуется построить модели анализа и прогноза демографической ситуации в регионе, анализа заболеваемости, анализа соответствия необходимых объемов медицинской помощи возможностям существующих медицинских учреждений и т. п. Каждая из перечис ленных подзадач имеет самостоятельное значение, однако чтобы осуществить ежегодное планирование медицинской помощи в регионе, необходимо выполнить целенаправленный связный расчет с применением всего комплекса моделей. Для этого помимо средств сохранения результатов расчетов каждой модели необходимо обеспечить управление расчетами в зависимости от состояния задачи.

Построение управляемых комплексов ОЬАР-моделей для сложных аналитических задач предлагается осуще-

* Работа выполнена при финансовой поддержке гранта ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг. (ГК № 02.740.11.0621) и гранта ККФПН и НТД (доп. соглашение № 01/10 от 17 мая 2010 г.).

ствлять на основе метаописания, которое включает в себя описание каждой модели, множество отношений между моделями, условия применения и коррекции моделей, условия альтернативного выбора модели. Метаописание комплекса ОЬАР-моделей осуществляется с применением специальной гибридной модели знаний декларативно-процедурного типа:

и=<ж, я, и>,

где Ж = {М,М,...,Мп} - описание множества моделей; Я - отношения между моделями; и - условия применения и коррекции моделей.

Каждая ОЬАР-модель Ме Ж представляется в виде

м=<х, о, Q(О), s(О)>.

Используются следующие обозначения:

X - дискретное множество входных данных модели (витрина данных);

О = <2, К> - гиперкуб - модель логического многомерного представления данных, характеризующаяся двумя наборами параметров: показателями 2 = <х,х2, ...хт> и измерениями ^ = </ / ./>. Каждый показатель представляет собой множество значений, количественно характеризующих анализируемый процесс. Каждое измерение представляет собой упорядоченное множество значений определенного типа. Множество измерений образует оси гиперкуба. Измерения могут быть организованы в виде упорядоченной иерархической структуры;

Q(О) - функции, или процедуры, описывающие построение элементов гиперкуба О: показателей 2 и измерений ¥, исходя из множества входных данных Х, а также операции над гиперкубом: агрегирование гиперкуба по иерархии атрибутов выбранного измерения, срез гиперкуба О по одному или нескольким заданным измерениям, операции поворота гиперкуба, изменяющие порядок измерений в гиперкубе;

S(О) - описание результатов вычисления ОЬАР-мо-дели, обычно сохраняемых в виде таблиц агрегатов. Особенностью технологии ОЬАР является возможность наглядной визуализации результатов обработки в виде таблиц, кросс-таблиц, диаграмм, а также динамических картограмм [2].

Для описания моделей в работе [7] предложен специальный язык и разработаны программные средства генерации в этом языке скрипта ОЬАР-модели, который генерируется в результате ее интерактивного формирования в программной системе. Однако работать со скриптовым представлением оказалось довольно сложно, поскольку комплекс может содержать большое число моделей. К примеру, для задачи ежегодного планирования медицинской помощи комплекс включает более сорока ОЬАР-моделей.

Для повышения обозримости комплекса нами введено краткое метаописание ОЬАР-модели М в виде кортежа: М: <витрина данных>; <назначение модели>;

<результат>.

Метаописание каждой модели М в базе знаний формируется автоматически, с помощью специально разработанного программного обеспечения на основе скрипта.

Для реализации управляемых расчетов, помимо описания отдельных моделей, необходимо описать их взаи-

мосвязи. Это осуществляется путем описания отношений между моделями и условий их применения.

Основной вид отношений между моделями - отношение информационной зависимости моделей М ® М, которое определяет необходимость предварительного расчета модели М1 для последующего расчета модели Ы2. Обычно это отношение имеет место, если результаты вычисления М1 используются как исходные данные для М. Отношение информационной зависимости применяется для построения упорядоченных цепочек расчета ОЬЛР-моделей. Можно также использовать отношение альтернативного выбора модели для случая, когда разные модели решают одну и ту же задачу разными методами.

Условия применения моделей описываются с помощью правил следующего вида:

Я^. ЕСЛИ Р(х1,х2, ..., хи)

ТО ВЫПОЛНИТЬ М/ ИЗМЕНИТЬ М,

где Я1 - уникальное в базе знаний имя правила; х1, х2,., хп - показатели, заданные как результаты расчета какой-либо модели, либо заданные в витрине как исходные данные. Каждый показатель представляет собой многомерный куб, описанный в витрине данных соответствующей ОЬЛР-модели. Предикат Р задается в виде логико-лингвистического выражения. Операция ВЫПОЛНИТЬ М в правой части правила Я1 интерпретируется как выполнение расчета ОЬЛР-модели М. Если в процессе логического вывода правило Я1 применяется, то это приводит к расчету показателей - результатов модели М. Как следствие, должны быть пересчитаны все информационно зависимые ОЬЛР-модели. Операция ИЗМЕНИТЬ М в правой части правила интерпретируется как переход к интерактивному процессу коррекции модели М. Пример правил такого типа приведен ниже.

Алгоритмы управления аналитическим расчетом. Метаописание комплекса ОЬЛР-моделей используется в управляемых расчетах следующим образом. Генерация цепочек ОЬАР-моделей выполняется на основе их метаописания как процедура логического вывода на гибридной базе знаний. Процедура вывода представляет собой интерактивный процесс, позволяющий производить многовариантный расчет сложных многоэтапных задач.

Управление процессом расчета осуществляется на основе применения правил выполнения и выбора ОЬЛР-моделей, а также с учетом действий пользователя. Пользователь может интерактивно изменить или заменить любую модель, вследствие чего изменяется ее системное представление. Также пользователь может изменить условия применения, изменив метаописание в базе знаний. Процедура логического вывода учитывает оба варианта. При этом автоматически исследуются возможные изменения расчета и строятся новые цепочки моделей. Кроме того, продукционные правила позволяют не только указывать условия применения моделей, но и в явном виде задавать в базе знаний такие важные элементы, как критерии согласованности показателей.

Рассмотрим алгоритм логического вывода, позволяющий выполнять управляемый многовариантный расчет на примере расчета Территориальной программы

государственных гарантий оказания населению бесплатной медицинской помощи (далее - ТПГГ) с применением метаописания комплекса ОЬАР-моделей [8].

Чтобы выполнить процесс генерации цепочек ОЬАР-моделей, позволяющих рассчитать показатели объемов медицинской помощи и нормативы требуемого финансирования, а также выполнить согласование этих показателей, применяется построенное метаописание комплекса моделей. Генерация цепочек ОЬАР-моделей для расчета ТПГГ выполняется как интерактивный процесс логического вывода, позволяющий производить много-

вариантный расчет ТПГГ либо в целом, либо отдельных ее фрагментов. Управление процессом расчета выполняется на основе применения правил выполнения и выбора ОЬАР-моделей, а также с учетом действий пользователя.

Рассмотрим алгоритм расчета с применением обратной цепочки вывода на базе знаний, представляющей метаописание комплекса моделей (рис. 1). Алгоритм условно можно разделить на три этапа: формирование цепочек ОЬЛР-моделей, генерация скрипта цепочек и сам процесс расчета.

Рис. 1. Алгоритм расчета выбранных показателей

Построение цепочек предполагает определение зависимых моделей. Задаются показатели, которые необхо -димо рассчитать. Автоматически определяются необходимые для этого модели и порядок расчета. По описанию в базе знаний находятся модели такие, от которых информационно зависит какая-либо модель из числа помещенных в цепочки. Соответствующие цепочки дополняются.

Результирующие цепочки должны удовлетворять следующему требованию: любая зависимая модель должна располагаться в цепочке не раньше любой модели, от которой она информационно зависит; для каждой пары моделей в цепочке, если имеет место отношение М1 ® М, то М1 должна предшествовать М2 в цепочке. Это требование обеспечивает корректность расчетов.

Затем формируется скрипт построенных цепочек моделей (рис. 2). Для этой цели используется системное описание моделей и правила выполнения и выбора моделей, представленные в базе знаний. В зависимости от вида правил формируются и вставляются в скрипт цепочек управляющие элементы.

Полученный вариант расчета ТПГГ можно сохранить, затем изменить методику расчета, изменив модели или условия выполнения моделей, и вновь выполнить расчет.

Таким образом, можно получить несколько вариантов расчета ТПГГ и выбрать из них наиболее рациональный.

Многовариантный расчет можно выполнить также для того, чтобы применить разные модели балансировки показателей ТПГГ. Уточнение и балансировка показателей необходимы для согласования требуемых объемов медицинской помощи и выделенного финансирования. Можно изменить порядок расчета моделей балансировки, изменив в базе знаний приоритеты правил применения этих моделей.

В случае если в результате интерпретации правила Яр описывающего в базе знаний условия выполнения, или изменения ОЬАР-модели, или отдельного показателя, оказалось, что левая часть правила - условие - оказалось выполнено, то в скрипт расчетной цепочки, куда помещена модель в результате выполнения предыдущего алгоритма, добавляется скрипт, позволяющий инициировать соответствующее действие. При этом, если в результате интерактивного взаимодействия с пользователем модель изменяется, то по алгоритму (см. рис. 1), это приводит к возврату к построению последовательности расчета заново.

Рассмотрим алгоритм проверки условия правила, содержащего многомерные показатели (рис. 3). Алгоритм записывается следующим образом:

( Начало )

п - число правил

нет

Условие правила Р = «истина»

да

нет

Рис. 2. Алгоритм формирования управляющих элементов в цепочке моделей

Я1: ЕСЛИ (х1 ~ а1) И (х2 ~ а2)

И ... И (х ~ а) ТО ВЫПОЛНИТЬ М.

4 п п

Суть алгоритма состоит в том, чтобы сравниваемые многомерные показатели привести к одинаковой размерности. Для этого по несовпадающим измерениям производятся срезы. Затем значения показателей, имеющие одинаковое положение в построенном кубе, попарно сравниваются, если отношение выполняется для всех пар, то условие правила истинно, в противном случае - условие ложно. Если показатели не имеют общих измерений, условие ложно.

Таким образом, рассмотренные алгоритмы позволяют выполнять расчет показателей путем реализации обратной стратегии логического вывода на знаниях, представляющих метаописание комплекса моделей.

Пример сводного расчета объемов медицинской помощи по круглосуточным стационарам представлен на рис. 4.

Таким образом, предложенный способ метаописания связных комплексов ОЬЛР-моделей, основанный на декларативно-процедурной модели знаний, позволяет осуществлять управление многовариантными аналитическими расчетами путем построения упорядоченных цепочек ОЬЛР-моделей. Особенностью является возможность применения многомерных условий в правилах,

Начало

Выполнить срез Ж; по измерению f

описывающих порядок вычисления моделей. Представленные алгоритмы управления аналитическим расчетом в комплексе применены для расчета показателей территориальной программы бесплатной медицинской помощи. Выполнена программная реализация полученных результатов. Программное обеспечение внедрено в агентстве здравоохранения Красноярского края.

Библиографические ссылки

1. Ноженкова Л. Ф., Шайдуров В. В. OLAP-технологии оперативной информационно-аналитической поддержки организационного управления // Информ. технологии и вычислит. системы. 2010. N° 2. С. 15-27.

2. Ноженкова Л. Ф., Евсюков А. А., Ноженков А. И. Методы управления и геоинформационного моделирования в технологии OLAP // J. of Siberian Federal University. Engineering & Technologies. 2009. № 2(1). С. 49-58.

3. Арсеньев С. Б., Бритков В. Б., Маленкова Н. А. Использование технологии анализа данных в интеллектуальных информационных системах // Управление информ. потоками : сб. тр. Ин-та системного анализа РАН. М. : Эдиториал УРСС, 2002. С. 47-68.

х,, а,- показатели, I = 1,п п - число условий

Рх, - множество измерений х, Ра, - множество измерений а,

-K^yf: f Fx) & (f є FaJ^>-

Выполнить срез ai по измерению f

-<<yf : (f є Fx) & (f є Fa)^X

Условие правила Условие правила

ложно истинно

( Конец ^

Рис. 3. Алгоритм проверки многомерного условия правила 83

4. Методы и модели анализа данных: OLAP и Data Mining. / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. СПб. : БХВ-Петербург, 2004.

5. Манди Д. К вопросу об OLAP [Электронный ресурс] / под ред. Р. Кимбалла // Intelligent Enterprise. 2003. № 18. URL: http://iemag.ru/?ID=473963 (дата обращения: 23.11.2010).

6. Висков А. В., Фомин М. Б. Средства описания многомерных моделей данных // Вестник РУДЛ Сер. Прикл. и компьютер. математика. 2003. Т. 2. № 1. С. 128-139.

7. Ишенин П. П. Инструментальные средства построения комплексов моделей и аналитических приложений в ОЬЛР-технологии : автореф. дис. ... канд. техн. наук. Красноярск, 2006.

8. Ноженков А. И. Интеллектуальные средства ОЬЛР-моделирования в задачах планирования медицинской помощи // Открытое образование (Приложение). Красноярск : Экспресс-Офсет, 2006. С. 156-160.

* ПІТ | Hrjp, I И аЬї]

Л Обмыты

HVTpfliKi Овчі ПММЦЬ

3 1

H«TON*.4 СЫДО+ПЪ SSiffciTb

- ,9 X

І№>ЮІЙ ГОД jjflBft ^rj

Q Hop.UTufcJ М$ЬЄМ» МВД4ДОЄИАЙ Гіу^ьии

(5^- СтОшнМТЪ (MWhuu

(g? ФівчКі-ДОІ Щ-4 *"Ф;|Л(Где(фПДОа.ґЬт'#С Q «МНфОИМ

Стдвнжчі- Вез™ І Сглиня-ир QMC Свої | Стдркпф Баз wer - Сна ф^Йгіар, -Врвпі- См* | Ерв№Мбл**4 | Пшгр-»ма|

. -

.і* л- /Л 'Xі "

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

илгоп

одр- 14 Стй-гтда’і тгі‘"ад* ітпошн ,.

%

■ Ачмне*

Е-*чкт*«ій.мн

БчМНЮСШій

Еет<отші ГтвйМКГЧНКя

Для «донижи

Для

Инфдкцмог-f-wa

ПДОЛВПМ МДО4ЯМКІН

Пбпдоінр ЖХНфС хд ннл

ПкіИЩРЖНПИ

\аЄ~ш\

ММШі &мС И rlw.il ЧИСЛО КЄГ-5 «М£ !■ ОіШлІТ 1*ягг] '-ІНС/Ю П№ИЧ|*»И йагым: кн; ВИЇ И ї«Л«+т І,греало«а-ие'І Міцело »-ги^*л : К ■ йкюиет : ЙЧИЙ.Ч+:+«н+| j

ВД04 2I1J00 ■ ' А № sosoo

ЗШГ i&WOQ й4заю ЭИЖОО

«4ЭЭ mm 15ЮГО 21 41600

23121 лооа 413D DO 16 soi ,oo

3Z253 143.00 3K5DO І1Ш00

231* піоа 23Л DO iS Sisf.OQ

31Я29 зіоа TUB DO ?azoo

17ЧИ6 13J00 4ПП [ЦІ £FOO CO

іліос. 100 MG DO 562 OO

а ак 2700 STDlOO 3+50,00

шаі 27,00 ДЯШ

жтз 11J00 лого £4ffltt)

2Є&00 1J00 HDD QCO

337. ТЕ 2SOD B-35DO S 001.00

33134 В7 00 1 302 DO 1Э 321 00

Цддцдщі ' tencnbnm ИП

1 .

Ж?!

фц-инсы

Рис. 4. Сводный расчет объемов медицинской помощи по круглосуточным стационарам

A. I. Nozhenkov

OLAP-MODELS CONTROLLED COMPLEX CONSTRUCTION

OLAP-models complex meta-description means for solving complicated analytical problems are presented. Control calculation algorithms are described. The results were applied for territorial planning of medical assistance.

Keywords: OLAP-model, OLAP-model complex, control, multidimensional data, hybrid knowledge model, control calculation algorithms.

© HoweHKoe A. M., 2010

i Надоели баннеры? Вы всегда можете отключить рекламу.