Документирование больших баз данных

Мозжилкин В.В.; Ромакина О.М.

жался на компьютере более 2 часов. Применение быстрого алгоритма расчёта дало возможность вычислить закон распределения суммы при т=3 и л=1024. В качестве примера в табл. 1 приводим результаты расчёта распределения суммы 512 случайных величин имеющих следующий ряд распределения.

Таблица 1

0 1 2

Pi 0.25 0.25 0.5

В табл. 2 приводим некоторые значения А'(их общее количество равно 1025) в законе распределения £ - суммы 5 12 случайных величин, вероятности этих значений Р(^=Х), вероятности Р(1<Х) и Р(^<Х), значения Ртям функции распределения, вычисленной в соответствии с предельной теоремой по нормальному закону.

Таблица 2

X P(t=X) P(t£X) Fnorm

550 0.00000028 0.00000098 0.00000126 0.00000083

565 0.00000847 0.00003478 ' 0.00004325 0.00003216

580 0.00013793 0.00069975 0.00083768 0.00069193

595 0.00122603 0.00799958 0.00922561 0.00823104

610 0.00591074 0.05262915 0.05853989 0.05490967

625 0.01534233 0.20407710 0.21941943 0.21199919

640 0.02125447 0.48792393 0.50917840 0.50000000

655 0.01555425 0.77971276 0.79526701 0.78800081

670 0.00594144 0.94270207 0.94864351 0.9450.9033

685 0.00116838 0.991580/7 0.99274915 0.99176896

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Михайлов ВН., Точилкина С А. Метод расчёта закона распределения функции от дискретных случайных величии // Математика. Механика: Сб. науч. тр. Саратов: Изд-во Сараг. ун-та, 2001. Вып. 3. С. 86 - 89.

2. Михайлов В.П., Точилкина С.А. Распределение векторной функции от независимых дискретных случайных величин // Математика. Механика: Сб. науч. тр. Саратов: Изд-во Сараг. ун-та, 2002. Вып. 4. С. 93 - 96.

УДК 681.3

В. В. Мозжилкин, О. М. Ромакина ДОКУМЕНТИРОВАНИЕ БОЛЬШИХ БАЗ ДАННЫХ

Разработка и документирование больших баз данных (БД) представляет собой серьёзную проблему вследствие значительного объёма информации, хранящейся в БД. По этой причине важны средства компактного описания проектных решений. В настоящее время широко используются CASE - средства, основанные на графической реализации модели сущ-

72

ность - связь [1J. К ним относятся Erwin [2] и Data Modeller языка UML [3]. Они позволяют в наглядной форме проектировать и документировать БД. Однако анализ графических документов, содержащих большое количество таблиц и связей, достаточно сложен. В [2] эта задача упрощается, если при описании вводить рабочие области, строго говоря, предназначенные для решения других задач. Рабочие области изолированы друг от друга, и взаимодействия между ними можно определить лишь искусственно, вводя специальные пересечения областей, содержащие требуемые свя'зи.

Помимо схем отношений и связей при документировании больших БД необходимо в строгой лаконичной форме определить триггеры и хранимые процедуры, представляющие собой поименованные блоки кода SQL. Однако полное их описание даётся или в вербальной форме в соответствующих определениях или заметках, или приходится детально изучать сам текст на SQL, что неудобно.

В [4] для описания БД оперативного управления процессом грузовых перевозок по железной дороге используется теоретико-множественный подход, который позволяет в компактной строгой форме определить информационное наполнение БД. Но в нём нет определения схемы отношения. Фактически предлагается структура кортежей без определения ключей, не являющаяся реляционной. Поэтому связи на них задать невозможно. Этот язык можно использовать при формулировке требований к информационной среде, но необходим дополнительный этап собственно проектирования БД.

В данной статье предлагается для документирования больших БД использовать непосредственно аппарат реляционной алгебры [5]. Домены задаются либо непосредственным указанием множества значений, либо указанием множества операций, порождающих множество значений. Исходные таблицы задаются своими схемами отношений. Производные таблицы определяются с помощью суперпозиции операторов реляционной алгебры. Формально все возможные связи можно определить, отслеживая ключи, принадлежащие одноименным доменам. Однако, помимо того, что этот неявный подход чрезвычайно затрудняет понимание структур связей и не позволяет определить совокупность реализованных в БД связей, он не даёт возможности задавать кардинальные числа связей. Поэтому предлагается использовать систему обозначений, близкую к стандарту IDEF1X [6].

Для описания триггеров и хранимых процедур предлагается использовать обобщение алгебраических спецификаций типов данных [7] для схем отношений.

Язык для описания структур баз данных включает в себя следующие конструкции.

Для описаний схем отношений введём следующие обозначения.

Пусть г, s - отношения со схемой R,

и - отношение со схемой ,

v - отношение со схемой Я2 и К2 Е Я, R' = R - Я2, t - любой кортеж в г,

А, В - атрибуты, Л е Л, В iR- А, где dorn(A) = clom(B), X - подмножест во из R.

Для построения производных таблиц будем использовать следующие операторы реляционной алгебры [5]: объединения, пересечения, взятия разности отношений, оператор выбора, оператор выбора всех кортежей из базового отношения, оператор проекции, оператор деления, оператор переименования, операторы 0-соединения и 0-выбора.

Пусть РК( г ) = Aj - первичный ключ отношения r, Aj - атрибут

отношения г; СК(г) = Ак - альтернативный ключ отношения г, Ак - атрибут отношения r\ FK(/-)m (delete option, update option) = Ai - внешний ключ отношения r, где базовым отношением является отношение и, Л, -атрибут отношения г. Здесь

update - операция обновления объекта ссылки внешнего ключа; delete - операция удаления объекта ссылки внешнего ключа; option = {restricted, cascades};

restricted - ограничение совершения операции над базовым отношением и до момен та, когда не будет существовать соответствующих значений внешнего ключа в отношении г ;

cascades - каскадирование совершения операции над базовым отношением и, также совершая операцию над соответствующими значениями внешнего ключа в отношении г.

Для работы с null-значениями необходимо ввести дополнительные обозначения:

Aj null not allowed (в качестве значений данного атрибута null-

значения недопустимы);

Aj null allowed (в качестве значений атрибута допустимы null-

значения).

Введём специальные конструкции для определения связей между отношениями. Пусть Ru R2 - схемы отношений. Условные связи 1:1 между ними по соответствию ключей кп,...,к:т отношения Л, (/ = 1,2) определим следующим образом:

R, <—7—г—7—т->R2.

Условные связи 1 : M задаются следующим образом: Rl —I-1-1-Г-*К2 ■

1 *Н=*2.............

Если одно из отношений в связи обязано иметь по крайней мере один экземпляр, то оно помечается точкой.

При описании связи схемы отношений можно задавать явно, но можно использовать ранее определённые имена отношений.

74

При совпадении имён ключей в связываемых отношениях можно вместо равенства ключей использовать только имя ключа.

Можно определить, если необходимо, рабочие области, перечислив множества отношений, их образующих, с указанием связей внутри области. Связать рабочие области можно, определив необходимые связи между отношениями, принадлежавшими разным рабочим областям. В этом случае следует использовать составные имена отношений:

<Имя_рабочей области>.<Имя_отношения>.

Данная методика была использована при разработке БД сменно- суточного планирования грузовых железнодорожных перевозок [8|.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Цикритзис Д., Лоховски Ф. Модели данных. М.: Финансы и статистика, 1985.

2. Маклаков С.В. BPWin и Erwin. Case средства разработки информационных систем. М.: Диалог-ММИФИ, 1999.

3. Мюллер РД. Базы данных и UML. М.: Лори, 2002.

4. Гершвальд A.C. Оптимизация оперативного управления процессом 1рузовых перевозок на железнодорожном транспорте. М.: Интскст, 2001.

5. МейерД. Теория реляционных баз данных. М.: Мир, 1987.

6. Описание стандартов. IDEF1X. www.citforum.ru

7. Заму пин A.B. Системы программирования баз данных и знаний. Новосибирск: Наука. Сиб. отд-с, 1990.

8. Ьпипков ЮЛ., Иванов В.А., Ковалев АД., Мозжилкин В.В., Орёл A.A. Применение генетических алгоритмов к задаче оперативного планирования грузопотоками на железной дороге // Компмотерныс науки и информационные технологии: Тез. докл. междунар. конф., посвящ. памяти проф. A.M. Богомолова. Саратов, 14 18 мая 2002 г. Саратов: Изд-во Сарат. ун-та, 2002. С. 10.

УДК 517.51.518

И. Д. Молодснкова

ОЦЕНКИ ПОГ РЕШНОСТИ ВОССТАНОВЛЕНИЯ ПРОИЗВОДНОЙ

Пусть /(x)eW22[a,£>], где W22[a,fo] одномерное пространство Соболева с нормой ||/||tv2 j[/ 2 (*) + (/ "С*))2]5^ -Пусть ka - интегральные

операторы (а>0 - параметр) с ядрами ka(x,t) такие, что kaf eC'[a,b] и

IM"/1см, прИ

Рассмотрим два класса функций:

1) Д22[-л,я]= \f(x)e Wi[-K,n]: /<*>(-я)= fW(*), *=0,1; Ц/Ц^ <lj,

2) Ц22[0,1]=(/(д:)е^22[0Д]:||/|^ <l|,

Документирование больших баз данных Текст научной статьи по специальности «Компьютерные и информационные науки»

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мозжилкин В.В., Ромакина О.М.

Текст научной работы на тему «Документирование больших баз данных»