Научная статья на тему 'Методика синтеза структуры витрины данных медико-генетического мониторинга'

Методика синтеза структуры витрины данных медико-генетического мониторинга Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
129
44
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Воронков К. Л., Шерстюк Ю. М., Романенко А. И.

В статье описаны основные положения методики проектирования структуры единой витрины данных медико-генетического мониторинга, осуществляемого в медико-генетическом центре на основе сведений, аккумулируемых в эксплуатируемых информационных системах учетного типа. Работа выполнена при поддержке «Фонда содействия отечественной науке», РФФИ (проект № 05-07-90088).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Воронков К. Л., Шерстюк Ю. М., Романенко А. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Technique of Data Mart Structure Synthesis for Medical Genetic Monitoring

The article treats the principles of design of a common data mart for medical genetic monitoring. The medical genetic monitoring is carried out at a medical genetic centre which uses data accumulated in informational systems of registration type.

Текст научной работы на тему «Методика синтеза структуры витрины данных медико-генетического мониторинга»

УДК 504.75

МЕТОДИКА СИНТЕЗА СТРУКТУРЫ ВИТРИНЫ ДАННЫХ МЕДИКО-ГЕНЕТИЧЕСКОГО МОНИТОРИНГА

К. Л. Воронков,

ведущий инженер отдела специальных информационных систем Ю. М. Шерстюк, доктор техн. наук, доцент, зам. директора по научной работе

Федеральное государственное научное учреждение «Научно-исследовательский конструкторско-технологический институт биотехнических систем»

А. И. Романенко, программист

Санкт-Петербургский консультационно-диагностический медико-генетический центр

В статье описаны основные положения методики проектирования структуры единой витрины данных медико-генетического мониторинга, осуществляемого в медико-генетическом центре на основе сведений, аккумулируемых в эксплуатируемых информационных системах учетного типа.

The article treats the principles of design of a common data mart for medical genetic monitoring. The medical genetic monitoring is carried out at a medical genetic centre which uses data accumulated in informational systems of registration type.

Систематическое наблюдение за состоянием генофонда популяции, которое дает возможность оценивать существующий мутационный процесс и прогнозировать его изменения, представляет собой процесс медико-генетического мониторинга (МГМ), осуществляемого медико-генетической службой (МГС). В соответствии с приказом Министра здравоохранения РФ № 316 от 30.12.1993 г. «О дальнейшем развитии медико-генетической службы Министерства здравоохранения Российской Федерации» организация работы МГС РФ строится по территориальному признаку, а ее структура имеет три основных уровня: районный (городской), региональный (межрегиональный) и федеральный.

Региональный уровень МГС представлен региональными и межрегиональными медико-генетическими консультациями (центрами), которые формируются как самостоятельные учреждения или в составе лечебно-профилактических учреждений (ЛПУ).

Одним из важнейших направлений деятельности медико-генетического центра (МГЦ) является комплексный анализ медико-генетического состояния популяции, своевременное выявление тенденций его развития, оценка влияния на него различных факторов.

Источниками данных МГМ для МГЦ являются как ЛПУ региона, так и его собственные подразделения.

Общая информатизация общества затронула и деятельность МГЦ в целом и их организационно-методических отделов в частности. Ее проявлением стало внедрение в МГЦ информационных систем (ИС) различного назначения, среди которых с позиций сбора данных МГМ можно выделить:

- автоматизированные регистры, ориентированные на персональный учет соответствующих пациентов и по своей сути представляющие электронные хранилища разновидностей медико-генетических карт пациентов;

- ИС, по своим возможностям в большой степени аналогичные автоматизированным регистрам, решающие задачи учета либо всех пациентов МГЦ (ИС типа «Регистратура»), либо отдельной категории с учетом выполняемого специфического обслуживания этих пациентов (ИС типа «Пренатальная диагностика», «Инвазивные операции» и т. д.).

Тем самым, большинство данных, собираемых в интересах МГМ (а в идеальном случае - все данные), могут быть аккумулированы в базах данных (БД) ИС МГЦ. Для решения частных задач анализа данных МГМ возможностей этих ИС обычно достаточно, по крайней мере, для формирования отчетных документов, предусмотренных федеральными нормативами.

Однако комплексный анализ данных МГМ с использованием только ИС учетного типа крайне затруднен по следующим причинам:

■ Рис. 1. Место ВД в автоматизированной системе комплексного анализа данных МГМ

- отсутствие единого информационного поля: по понятийному аппарату (в частности, по классификаторам), по способам учета пациентов и событий (по идентификаторам объектов мониторинга), по реализации (автономные БД различного формата);

- фиксированные и крайне ограниченные возможности по формированию отчетно-статистических документов, отсутствие аналитической обработки собираемых данных;

- разнородность форматов электронного представления формируемых отчетно-статистических документов, невозможность их совместной автоматизированной обработки.

Существенное повышение эффективности комплексного анализа данных МГМ может быть достигнуто за счет применения современных аналитических технологий - оперативной аналитической обработки данных (OLAP - On-Line Analyzing Processing) и интеллектуального анализа данных (ИАД) (Data Mining) [1].

В свою очередь, применение указанных технологий для комплексного анализа данных МГМ предполагает наличие в МГЦ витрины данных (ВД) - реляционной БД, предназначенной для централизованного накопления данных МГМ, собираемых в региональном МГЦ, и предоставления доступа к этим данным со стороны средств OLAP и ИАД (рис. 1).

На создание и заполнение ВД важнейшее влияние оказывают:

- структура и содержание БД ИС-источников, так как содержимое ВД является производным от возможностей этих ИС по сбору и хранению данных МГМ;

- ориентация ВД на поддержку применения OLAP-технологий, предусматривающих переход от реляционного представления и хранения данных к многомерному.

Проведенный анализ позволил выделить следующие особенности ИС-источников и их БД, существенные с позиций построения и заполнения ВД МГМ:

1) БД ИС-источников помимо данных МГМ содержат множество данных, к нему непосредствен-

но не относящихся: таблицы пользователей, журналы учета работы и т. д.;

2) для ИС возможны разного рода ошибки данных - недопустимые значения, нарушения логических связей и уникальности, целостности ссылок и т. д.;

3) наличие малоинформативных и неинформативных полей, когда, например, при проектировании ИС предусмотрен некий атрибут сущности, но на практике его значение никогда или почти никогда не задается;

4) в любой ИС учетного типа используются справочники и классификаторы, которые в большинстве своем уникальны - практически единственным унифицированным классификатором является Международный классификатор болезней (МКБ);

5) в учетных ИС практически никогда не ведется протокола (истории) изменений - карта пациента, извещение о врожденном пороке развития (ВПР) могут быть изменены в любой момент (во время или после приема, при поступлении новых сведений из ЛПУ и т. д.). Аналогичная ситуация имеет место и по отношению к справочникам - перечень ЛПУ, наименования улиц и т. д. корректируются пользователями произвольно по мере необходимости без протоколирования изменений;

6) имеются принципиальные объективные сложности с идентификацией объектов мониторинга. Причинами тому могут служить возможные изменения фамилий, адресов проживания и т. д.

Генезис вышеперечисленных проблем достаточно очевиден: ошибки проектирования и программной реализации ИС, недостатки организации применения ИС, ошибки персонала, недостаточная развитость классификационно-справочной базы, системы учета населения, объективные обстоятельства.

Ориентация ВД на поддержку применения OLAP-технологий приводит к тому, что в настоящее время широко используется размерная модель (Dimensional) и соответствующая методология проектирования [2-4], предусматривающая использование трех типовых структур (топологий): денормализованной таблицы; топологии (схемы) «звезда» («star»); топологии (схемы) «снежинка» («snowflake»).

Построение концептуальной модели первичных данных МГМ

Определение множества первичных БД /) /У) / /) V /

Специфицирование физической модели данных для БД первичных источников ■=> Dp(Bi) - (Tb„ Rр,). Tbi - {(Tbitij. Tbctijl).

Сокращение физической модели с учетом семантики и информативности данных Определение семантики таблии, столбиов и их значений Tba,, — (Than,,:.. ThaTbakijt. Tbar/ji). Rpi - {Rpul. Rpn — (Rpin. Rpon. Rptn. Rpmn!

Удаление служебных и неактуальных данных Получен ие кол и чественн ых характ ер ист ик содержим ого БДисто чн иков Анализ информативности колонок таблиц БД и удаление неинформативных колонок Коррекция множества связей |=> Dp’(Bi) - (Tb'i. Rp'i). Tb', - {(ТЬ'пц. Tba’ij. СТЬц}). Tba’ij — (Than,,:.. Tha/ Tbah,jt. Tbar,jt. CFTbaijt. DTba,jt). Rp'i - {Rpn}. Rpn — (Rpin. RpOn. Rptn. Rprrin)

Специфицирование логической модели данных для БД- ист очн иков первичн ых дани ых

■=> ВЦП,) - (El,. At,. Rl,)

Синтез интегральной концептуальной модели доступных данных МГМ

Денормализация структуры БД-источпиков

Объед инен ие миожеств денормал изованной структуры

Выделение идентичных и подобных атрибутов

Dk(B) = (Eh, Ah, Rh)

Синтез структуры ВД по содержимому интегральной модели

Определение множеств таблиц фактов, таблиц измерений и консольных таблиц, связей между таблицами

Анализ семантики атрибутов сущностей, построение иерархических измерений, изменение множеств таблии и связей

Расширение измерений для случая неопределенных данных

Верификация структуры ВД

Построение физической структуры ВД

Определение подмножества фиксированных таблиц измерений и консольных таблиц

Dm = (МТЬ, MRp), МТЬ = {(МТЪщ, МТЪап,}), MRp = {MRp,},

MRpi = (Rpii, Rpoh Rpti)

Dmp - (MTbp. MRp).

MTbp - {(MTbpn,. MTbpa,}).

MTba, - (MTbati . MTbati).

MTbah,j)

MTf — {(MTfpn ZTfpn,)}

■ Рис. 2. Содержание этапов синтеза структуры ВД МГМ

В то же время отсутствуют формальные процедуры синтеза структур ВД - выбор схем, определение состава и связей таблиц производится эвристически [4], и в конечном итоге все сводится к нахождению компромисса между временем выполнения запросов и затратами дисковой памяти и сложностью заполнения хранилища.

Для упрощения решаемой задачи построения ВД с учетом ориентации на ОЬАР в рамках описываемой методики приняты следующие правила:

- в таблицу фактов помещаются временные метки событий (если они есть), а также уникальные и псевдоуникальные атрибуты (например, фамилия пациента);

- таблицы размерности используются для линейных измерений, иерархических несбалансированных измерений и нижнего уровня иерархии сбалансированных измерений;

- консольные таблицы используются для иерархических сбалансированных измерений - кроме нижнего уровня.

Таким образом, в основе построения ВД лежит формирование ее структуры в виде композиции таблиц фактов, таблиц размерности и консольных таблиц, пригодных для размещения результатов очистки и преобразования первичных данных МГМ с учетом возможностей объединения этих данных по измерениям (справочникам и классификаторам).

Синтез структуры ВД должен выполняться в три этапа (рис. 2):

1) построение концептуальной модели первичных данных как множества моделей данных всех БД ИС-источников;

2) синтез интегральной концептуальной модели доступных (собираемых) данных МГМ, учиты-

вающей пересечения сведений в моделях первичных данных;

3) синтез структуры ВД по содержимому интегральной модели на базисе типовых структур, специфичных для ВД (в том числе из-за ориентации на применение OLAP).

Построение концептуальной модели первичных данных предполагает выполнение следующих действий.

1. Определение множества первичных БД.

Для определения множества БД, которые будут выступать в качестве источников первичных данных МГМ при создании и использовании ВД, необходимо:

- составить список БД информационных систем, эксплуатируемых в МГЦ, и исключить из него те БД, которые не имеют отношения к решению задач комплексного анализа данных МГМ, а также те БД, доступ к которым не обеспечивается телекоммуникационной платформой (вычислительной сетью) МГЦ, а перенос данных из них в ВД посредством машинных носителей нецелесообразен;

- если в МГЦ осуществляется регулярный экспорт всех данных МГМ из одной ИС в другую, исключить из списка те БД, которые являются источниками для процессов экспорта.

Базы данных, оставшиеся в списке, образуют множество B, над которым выполняются дальнейшие действия.

2. Специфицирование физической модели данных для БД первичных источников.

У каждой БД Bi, входящей в B, имеется физическая модель данных, благодаря чему можно получить ее формальные спецификации. Получение спецификаций в данном случае представляет собой часть процесса реинжиниринга БД (Reverse Database Engineering), методы и средства которого описаны, в частности, в работах [4-6]. Результатом реинжиниринга существующей БД Bt е B являются спецификации ее физической модели данных

Dp(Bi) = (Tbi, Rpi), Tbt = {(Tbnij, Tbaij}),

Tbaij = (Tbanijk, Tbatjk, Tbakjk, Tba j),

Rpi = {Rpil}, Rpil = (Rpiil, Rpoa, Rpta, Rpma), (1)

где Tbt - спецификации таблиц i-й БД, 1 < i < N, N = |B|; Tbntj - имя j-й таблицы i-й БД,1 < j < Nti, Nti - количество таблиц; Tbaij - характеристики столбцов j-й таблицы i-й БД; Tbanijk - имя k-го столбца 1 < k < Nkj; Tbattjk - тип данных k-го столбца; Tbakijh - признак ключевого столбца; Tbarф -признак обязательности значений; Rpt - спецификации связей таблиц i-й БД; Rpit - спецификации l-й связи i-й БД; Rpia - имя родительской таблицы l-й связи; Rpoil - имя дочерней таблицы l-й связи; Rptiil - тип l-й связи 1:1, 1:М; Rpmiil - признак обязательности связи.

3. Сокращение физической модели с учетом семантики и информативности данных.

Определение семантики таблиц, столбцов и их значений. Удаление служебных и неактуальных данных.

В спецификации каждой таблицы из Tbt и каждого столбца Tbaij необходимо добавить вербальный атрибут описания TbSj и TbaSj соответственно, значением которого должно быть описание семантики данной таблицы (атрибута), например, «список обследований», «фамилия», «диагноз» и др. Для определения семантики могут использоваться различные приемы: анализ мнемоники имен таблиц и колонок, анализ хранимых данных, сопоставление содержания записей таблиц и сведений в экранных формах и т. д.

В процессе определения семантики таблиц из множества Tbi должны быть удалены описания всех таблиц, не содержащих данных МГМ, а из каждого множества Tbaц - всех столбцов, не представляющих интерес с позиций комплексного анализа данных МГМ на региональном уровне.

Получение количественных характеристик содержимого БД-источников. Для каждой j-й таблицы, оставшейся в Tbi, необходимо получить значение количества имеющихся в ней записей СТЬц, а для каждого k-го столбца, оставшегося в Tbatj, - количество уникальных значений CUTbaijk и количество значений NULL CNTbatjk. Для тех столбцов, количество уникальных значений которых не превышает некоторой пороговой величины Nu, целесообразно выполнить частотный анализ этих значений (включая NULL). Результаты этого анализа имеют вид

CFTbaijk = {Zbaijkl, NZbaml}, \CFTbaijk\ < Nu,

где Zbaijki - l-е значение k-го столбца j-й таблицы i-й БД; NZbatjkl - количество появлений значения Zbatjkl в k-м столбце j-й таблицы i-й БД.

Помимо семантики столбцов зачастую необходимо определять и семантику значений, так как в БД для обозначения символьных значений часто используются числовые и логические (true/false) значения. Например, для столбца «пол» может быть принято, что значение 0 означает «мужской», 1 -«женский» или же наоборот. Для подобных столбцов необходимо строить таблицу соответствия вида

DTbaijk = ^^0-^ DSTbaijkl)}>

где DNbatjkl - l-е значение k-го столбца j-й таблицы i-й БД; DSTbaijki - символьное значение, соответствующее DNbaijkl.

Полученные количественные характеристики дают возможность выполнить анализ информативности колонок таблиц БД и удаление неинформативных колонок: используя значения показателя информативности колонки Ibaijk = = maxi (NZbaijkl) / CTbj, необходимо исключить столбцы, для которых Ibaijk больше некоторого порогового значения.

Завершающим этапом действий по сокращению физической модели является коррекция

множества связей - удаление из Rpt описаний всех связей, родительская и/или дочерняя таблица которых исключена из множества описаний таблиц.

После выполнения всех указанных выше действий формальные спецификации (1) с учетом введенных обозначений приобретают вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Dp'(Bi) = (Tb/, Rpi), Tbi = {(Tb'nij, Tbai/, CTbj),

Tbaij = (Tbanijk, Tbakijk,

CFTbajk, DTbai}k),

RPi = {RPi} RPil = (RPiiU RPoiU RPtib RPmil),

где Tb(<z. Tbi, Tba^j' с Tbav[, Rp{c Rpi и множества CFTbaijk, DTbatjk могут быть пустыми.

4. Специфицирование логической модели данных для БД-источников первичных данных.

Для каждой БД Bi, входящей в B, спецификации ее логической модели Dl(Bi) получаются по Dp'(B) путем формирования множеств имен сущностей {Ei}, имен атрибутов сущностей {Aj и отношений между сущностями {Roil}, а также задания отображений Rpei, Rpai, Rpr{.

Rpei ({Tb/}, {Ei}), Rpai ({Tba'ijk}, {A^}),

RPri ({RP(}, {Roil}),

где Ej - имя сущности; Aijk - имя атрибута сущности; Roa - имя отношения между сущностями.

Таким образом, получение спецификаций логической модели данных для БД Bi для БД ИС-источников заключается в переходе от таблиц, столбцов и связей к соответствующим сущностям, атрибутам и отношениям, а отображения Rpei, Rpai, Rprt фиксируют содержание этого перехода. Это действие - обратное переходу от логической структуры к физической структуре БД.

Следует учитывать, что одна таблица физической структуры может:

- не соответствовать ни одной сущности (таблица-справочник, используемая для хранений значений атрибута (атрибутов) и появившаяся в физической структуре как результат нормализации, например наименования улиц);

- соответствовать одной сущности - пациент, диагностическая процедура, беременность и т. д.;

- соответствовать двум и более сущностям.

Синтез интегральной концептуальной модели

доступных данных МГМ Dk(B) заключается в преобразовании множеств {El1, ..., ElN}, {Al1, ..., AlN}, { Rl1, ..., RlN} в множества Ek, Ak, Rk соответственно путем выполнения:

- приведения логической структуры БД Bt к первой нормальной форме, сопровождаемого элиминацией атрибутов, служащих для реализации соответствующих реляционных отношений - в результате денормализации исходные множества {El1, ..., EIn}, {Ah,-, AIn}, {Rl1, •••, RIn} преобразуются в множества {El/1, ..., El'N}, {Al\, ..., Al'N}, {Rl/1, ..., Rl'N} соответственно;

- объединения множеств [Е1\, ..., Е1'х), {А1\, ..., А1'м], {Ш^, ..., Ш'х) в множества ЕЙ, Ак, Як соответственно, при выполнении которого всем идентификаторам сущностей, атрибутов и отношений приписывается квалификационное имя, идентичное имени соответствующей базы данных;

- выделения идентичных и подобных атрибутов.

Если первое и второе действия элементарны, то на третьем следует остановиться более подробно.

Пусть имеются два атрибутаА1 и А2 со своими множествами допустимых значений Б1 и Б2 соответственно. Если для столбца, соответствующего атрибуту, множество Б^а не пусто, то в качестве домена этого атрибута следует использовать символические имена ББТЬа.

Будем считать, что:

-А1 эквивалентен А2 (А1 = А2), если они семантически идентичны и при этом множества их значений Б1 и Б2 совпадают;

-А1 подобен А2 (А1 = А2), если они семантически идентичны и при этом Б1 с Б2.

Для обработки идентичных и подобных атрибутов до тех пор, пока 3(Ь,у):((£ Ф у) л (А;, Ауе Ак) л ((А1 - А2) у (А1 = А2)), необходимо выполнить следующие действия:

- добавить в Ек новую сущность для хранения значений атрибута А1;

- добавить новое отношение «характеризует» типа 1:М между добавленной сущностью и всеми сущностями, которые содержат атрибут А1 или А2;

- атрибуты А1 и А2 исключить из Ак.

Данный алгоритм неприменим к атрибутам,

являющимся временными метками или количественными характеристиками.

Синтез структуры витрины данных по содержимому интегральной модели.

Применение в ВД типовых схем данных «звезда» и «снежинка» накладывает определенные ограничения на логическую структуру ВД. Основные правила ее синтеза достаточно просты:

- каждой сущности интегральной концептуальной модели, соответствующей событию МГМ и (как правило) содержащей атрибут - временную метку этого события, ставится в соответствие таблица фактов;

- сущности, непосредственно связанные с сущностями-фактами, образуют таблицы измерений, а остальные сущности - консольные таблицы.

Однако необходимо учитывать иерархические измерения, неопределенность исходных данных и требования к топологии ВД.

Иерархические измерения могут быть естественными (как, например, в случае МКБ) или искусственными. Искусственное измерение образуется во время синтеза структуры ВД путем анализа семантики атрибутов сущностей. Так, например, если сущность «пациент МГЦ» имеет атрибуты «проживание» с доменом {«в Санкт-Петербурге», «в области»} и «район города», то очевидно,

] - таблица фактов

1 — таблица измерений ти консольная таблица

■ Рис. 3. Пример структуры ВД МГЦ

что можно построить простое иерархическое измерение, разместить его в отдельной таблице измерений, а оба атрибута исходной сущности заменить идентификатором записи в построенной таблице измерений.

Иерархические измерения могут быть сбалансированными и несбалансированными [7]. Сбалансированное измерение (например, «ЛПУ - район») следует размещать в связанных таблицах, а несбалансированное измерение - в одной таблице, в которой для обозначения иерархии вводится атрибут «предок».

Если некоему атрибуту сущности ВД соответствует столбец таблицы БД-источника, для которого разрешена необязательность значений (ТЬау = = 0, даже если СЫТЬа^ = 0), то в соответствующее измерение должно добавляться значение «нет данных» (или что-то, ему аналогичное). Для иерархического измерения возможна ситуация, когда значение «нет данных» нужно вводить на нескольких уровнях иерархии.

Основное требование к топологии ВД можно сформулировать так:

- от каждой таблицы фактов может быть один и только один путь по отношению «дочерняя -родительская» к каждой таблице измерений или консольной таблице;

- от каждой консольной таблицы или таблицы измерений должен быть путь по отношению «ро-

дительская - дочерняя», по крайней мере, к одной таблице фактов.

При этом следует учитывать, что в принципе возможна ситуация, когда некая таблица выступает в качестве таблицы фактов и одновременно является таблицей измерений для другой таблицы фактов. Так, на рис. 3 схематично изображена логическая структура ВД, в которой таблица «Беременность» является и самостоятельной таблицей фактов, и таблицей измерений для таблицы «Обследование».

Результат синтеза логической структуры ВД Dm можно формально представить в виде

Dm = (MTb, MRp), MTb = {(MTbni, MTbani}),

MRp = {MRpi}, MRpi = (Rpii, Rpai, Rpt), (2)

где MTb - множество таблиц ВД; MRp - множество отношений между таблицами в ВД; MTbnt -имя i-й таблицы; MTbani - множество имен атрибутов i-й таблицы; MRpi - описание связи типа Rptt от таблицы Rpii к таблице Rpat.

Наличие логической структуры позволяет осуществить построение физической структуры ВД Dmp в виде

Dmp = (MTbp, MRp),

MTbp = {(MTbpni, MTbpai}),

MTbai = (MTbanij, MTbatj, MTbakj),

где MTbp - множество таблиц ВД; MRp - множество отношений между таблицами в ВД [идентично MRp в (2)]; MTbpnt - имя i-й таблицы; MTbpat - множество описаний столбцов i-й таблицы; MTbanij - имя j-го столбца i-й таблицы; MTbatj - тип данных j-го столбца i-й таблицы; MTbakj - признак ключевого столбца; MRpi -описание связи типа Rpti (1:1, 1:М) от таблицы Rpit к таблице Rpat.

Синтез физической структуры учитывает специфику системы управления базой данных, под управлением которой создается и будет функционировать ВД. В частности, это относится к правилам назначения (записи) имен таблиц и столбцов и поддерживаемым типам данных.

Завершающим действием, выполняемым при синтезе структуры ВД, является определение подмножества фиксированных таблиц измерений и консольных таблиц

MTf = {( MTfpni, ZTfpn)},

где MTfpni - имя таблицы (из числа ); ZTfpni -множество значений полей всех записей таблицы MTfpni.

К числу таких таблиц относятся таблицы с искусственными измерениями - как линейными, так и иерархическими. Эти таблицы являются неизменными (по крайней мере до перепроектирования ВД) и могут быть заполнены сразу после разметки.

Тем самым, конечным практическим результатом синтеза структуры ВД являются SQL-скрипты для разметки ВД и заполнения ряда ее таблиц.

Работа выполнена при поддержке «Фонда содействия отечественной науке», РФФИ (проект № 05-07-90088).

1. Методы и модели анализа данных: OLAP и Data Mining/ А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. СПб.: БХВ-Петербург, 2004. 336 с.

2. Решение проблемы комплексного оперативного анализа информации хранилищ данных // СУБД. 1997. № 5-6. С. 47-51.

3. Львов В. Создание систем поддержки принятия решений на основе хранилищ данных/ С. Д. Коровкин, И. А. Левенец, И. Д. Ратманова и др. // СУБД. 1997. № 3. С. 30-40.

4. Маклаков С. В. BPwin и ERwin. CASE-средства разработки информационных систем. М.: Диалог-МИФИ, 1999. 256 с.

5. Кузнецов C. Д. Введение в информационные системы // СУБД. 1997№ 2. С. 83-96.

6. Кузнецов С. Д. Основы современных баз данных. М.: Центр Информационных Технологий, 1998. 263 с.

7. Федоров А., Елманова Н. ADO в Delphi: Пер. с англ. СПб.: БХВ-Петербург, 2002. 816 с.

УДК 519.2(0Т5) ББК 22.1Т6яТ3 ЕТ8

Ерош И. Л., Сергеев М. Б., Соловьев Н. В.

Е78 Дискретная математика: Учеб. пособие /СПбГУАП. СПб., 2005.

144 с.: ил.

ISBN 5-8088-0169-9

Учебное пособие содержит как традиционные разделы дискретной математики: теорию множеств, булеву алгебру, комбинаторику, теорию графов, - так и ряд разделов, которые обычно не входят в учебники по дискретной математике, но исключительно важны для специалистов в области вычислительной техники, а именно: теорию дискретных групп, теорию чисел, теорию разрядных вычислений.

Пособие ориентировано на студентов технических университетов, аспирантов и преподавателей дисциплины «Дискретная математика».

По вопросам приобретения книги обращаться по адресу:

190000, Санкт-Петербург, Б. Морская ул., д. 67, ГУАП,

Фундаментальная библиотека

Телефон:(812)710-66-42

Факс: (812) 313-70-18

E-mail: [email protected]

ДИСКРЕТНАЯ

МАТЕМАТИКА

i Надоели баннеры? Вы всегда можете отключить рекламу.