Научная статья на тему 'Семантика реляционных баз данных с неопределенными значениями'

Семантика реляционных баз данных с неопределенными значениями Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
210
40
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Танянский Сергей Станиславовоич, Кобзев Игорь Владимирович, Яковлева Ирина Александровна

Рассмотрен один класс реляционных баз данных с неполной информацией. Для поддержки такой базы данных в актуальном состоянии предложена модификация реляционных операций проекции и естественного соединения. Результатом применения модифицированных операций является слабоуниверсальное отношение. Для глобальной поддержки функциональных зависимостей определено “условие вхождения схем” несогласованных отношений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Semantic of relation data base with indeterminate values

When considering a data base as a semantie whole, it is necessary to have means allowing to manipulate with all data (including indeterminate ones) in the relations. To support the BD with indeterminate values in the actual state it is offered to widen the relation algebra through modification of some operations. Possible situations of these operations application are considered.

Текст научной работы на тему «Семантика реляционных баз данных с неопределенными значениями»

тельности векторы знаков: 1111010110 1000101010 1011100011011 001100110 1001100110100 110010101110001010111000.

Определим количество разрядов n в каждом векторе знака Zj (j=1..8) и выделим вектор с ошибкой: это вектор знака Z4 (n‘=11 > n=10). Значит, в векторе этого знака произошла ошибка вставки двоичного разряда. Для исправления ошибки вычислим и проанализируем следующие значения:

її

1) S4= 2 e‘ ‘* 1 = 1+2+4+5+8+9=29;

і=ї

2) P4=29 mod 11=7;

3) ю4=6;

4) так как Р4>ю4(У) (7>6), то отбрасываем любую единицу, правее которой есть n+1-P4=10+1-7=4 нуля. Значит исправленный вектор есть 110100110.

По табл. 3 определяем символы, соответствующие ШК-знакам: 48200022.

Таким образом, предложенный ШК InsertCode обладает спобностью исправлять однократные ошибки вставки двоичного разряда, возникающие в пределах ШК-знака. При этом его численные характе-

ристики (физическая плотность, информационная избыточность) сравнимы с характеристиками известных ШК.

Литература: 1. Аршинов М.Н., Садовский Л.Е. Коды и математика. М.: Наука, 1983. 144 с. 2. Липский В. Комбинаторика для программистов. М.: Мир, 1988. 213 с.

Поступила в редколлегию 26.03.98

Дичка Иван Андреевич, канд. техн. наук, доцент кафедры специализированних компьютерных систем, заместитель декана факультета прикладной математики Национального технического университета Украины "Киевский политехнический институт". Научные интересы: штриховое кодирование информации. Адрес: 252000, Киев, пр. Перемоги, 37, НТУУ “КПИ”, ФПМ, корп. 15, к. 101, тел. (044) 4411323.

Сулема Евгения Станиславовна, младший научный сотрудник кафедры специализированных компьютерных систем Национального технического университета Украины "Киевский политехнический институт". Научные интересы: штриховое кодирование информации. Адрес: 252000, Киев, пр. Перемоги, 37, НТУУ “КПИ”, ФПМ, корп. 15, к.112, тел. (044)4411323.

УДК 681.3.016

СЕМАНТИКА РЕЛЯЦИОННЫХ БАЗ ДАННЫХ С НЕОПРЕДЕЛЕННЫМИ ЗНАЧЕНИЯМИ

ТАНЯНСКИЙ С. С, КОБЗЕВ ИВ, ЯКОВЛЕВА ИА.

Рассмотрен один класс реляционных баз данных с неполной информацией. Для поддержки такой базы данных в актуальном состоянии предложена модификация реляционных операций проекции и естественного соединения. Результатом применения модифицированных операций является слабоуниверсальное отношение. Для глобальной поддержки функциональных зависимостей определено “условие вхождения схем” несогласованных отношений.

1. Введение

Термин “неопределенные значения” широко применяется в [1-3] по базам данных (БД) для специальных значений, которые возникают по ряду причин. Здесь этот термин используется в узком смысле: “значение существует, но неизвестно”. Различные вхождения неопределенных значений в одно отношение обозначают различную семантику данных.

Для поддержки БД с неопределенностями в актуальном состоянии расширим реляционную алгебру за счет введения в множество допустимых значений термина “не определено” и модификации некоторых операций.

2. Реляционная алгебра на множествах с неопределенны ми значениями

Наиболее очевидным “узким местом” реляционной модели данных является неразвитость средств выражения ограничений целостности, какие в общем случае требуется накладывать на отношения, связи между которыми нарушены (иными словами, речь

идет о недостаточности средств выражения “семантики”). Например, обобщенные операторы естественного соединения рассмотренные в [2], не являются ассоциативными при соединении более чем двух отношений, что однозначно влияет на правильность представления данных.

Для решения этой задачи модифицируем оператор естественного соединения, при котором каждая строка (в том числе и несоединимые) попадает в соединение. Отличие от предложенных в литературе операторов заключается в следующем: во-первых, отношения, участвующие в соединении, являются определенными , во-вторых, несоединимые строки дополняются неопределенными значениями и присоединяются к результату.

Утверждение о том, что введенный оператор является ассоциативным для трех и более отношений, следует из определения полностью соединимых кортежей [2], дополняя недостающие значения при соединении неопределенными значениями.

Рассмотрим модифицированную операцию проекции для отношений с неопределенными значениями. Проекцией является отношение, полученное вычеркиванием соответствующих столбцов и исключением из оставшихся повторяющихся строк, а также строк с неопределенными значениями.

Определим алгебру на неполных отношениях.

Реляционной алгебре для неполных отношений будет соответствовать кортеж .

ИNDB =({R}, {d},пU, юU,©) , где {R} — множество схем отношений; {d} — множество отношений; п U — модифицированная операция проекции; ю U — модифицированная операция естественного соединения; © — операции реляционной алгебры.

Предложенная алгебра И NDB позволяет поддерживать функциональные зависимости путем соеди-

РИ, 1998, № 1

51

нения не полностью соединимых отношений, получив при этом отношение с неопределенными значениями в несоединимых кортежах. Полученное отношение удовлетворяет некоторой функциональной зависимости, если ее правая часть однозначно определяет левую или является неопределенным значением.

3. Слабоуниверсальное отношение

Рассматривая БД как единое семантическое целое, потребуем, чтобы атрибут имел одинаковый смысл всюду, где он появляется. Такой подход предполагает существование универсального отношения (УО) БД. Будем допускать отношения со схемами, являющимися подсхемами других отношений. Для того чтобы для БД существовало УО, определим ограничения на такие отношения. Пусть r (R) и s (S) — отношения в БД, причем r с s . Для УО множество атрибутов должно однозначно определять семантическую связь между ними. Поскольку R с S, то какова бы ни была связь между атрибутами в r , она должна быть частью связи между атрибутами S . Если t — строка в S , то t( R) должна быть строкой в г. Другими словами, в r должна входить п R (s) . Это ограничение будем называть условием вхождения схем.

Предположим, что БД содержит отношения r (R) и s (S), причем R с S . При таком вхождении может показаться, что разрешение на обновление s влечет за собой разрешение на обновление г. На самом деле разрешение на обновление s без разрешения на обновление r вполне обоснованно. Обновление r накладывает ограничение на обновление s, поскольку строка t не может быть добавлена к s, если t( R) g r . Это необходимо для поддержки ограничений, накладываемых на тип связи между отношениями.

Условие вхождения схем можно использовать и для поддержки функциональных зависимостей (F-зависимостей) при восходящем проектировании БД. Хотя БД не обязательно должна быть проекцией общего отношения, любое ее состояние в некотором смысле должно содержаться в таком отношении. В этом случае необходимо рассматривать УО, что невозможно при несогласованности БД.

На основе введенных ранее модифицированных реляционных операций определим понятие слабоуниверсального отношения для несогласованных БД. Пусть d — база данных со схемой R = {Rj ,... Rn } , причем U = Rju...uRn. Отношение s со схемой и будем называть слабоуниверсальным отношением для d, если пR. (s) с r(R.) для каждой схемы R. с R. Слабоуниверсальное отношение является результатом применения модифицированной операции естественного соединения ж U . Пусть дана база d( R) и множество атрибутов U, а также множество F F-зависимостей над U,. База d глобально удовлетворяет F, если для него существует слабоуниверсальное отношение s (U), и проекции s (U) на f удовлетворяют данному f . Здесь под операцией проекции понимается модифицированная операция, описанная выше.

Для базы d и множества f над u отношение s (U) будем называть F -слабоуниверсальным (в обозначении F - U) для d, если s — слабоуниверсальное отношение для d, удовлетворяющее F.

Утверждение. База d имеет f - U тогда и только тогда, когда d глобально удовлетворяет F.

Доказательство такого утверждения следует из определения f -слабоуниверсального отношения.

В случае, когда атрибуты одной схемы являются подмножеством атрибутов другой схемы, использование f - U значительно сократит временные затраты на поддержку глобального выполнения F-зависимостей.

В отношениях, для которых не выполняется условие вхождения, единственный способ проверки выполнения F-зависимостей состоит в рассмотрении кортежа на множестве всех атрибутов, т. е. на схеме БД. Такая проверка для каждого обновления БД требует слишком больших временных затрат. Однако если F-зависимости представлены ключами в схеме базы, то проверку того, что d имеет f - U , можно осуществлять более эффективно, используя ограничение на чужой ключ.

4. Синтаксические условия, накладываемые на схему с неопределенными значениями

В рассмотренной ситуации УО вводится с целью проверки выполнимости F-зависимостей БД в целом. Однако это противоречит задачи построения эффективной схемы.

Одно из возможных решений состоит в модификации операций над данными, гарантирующей переход БД в состояние, соответствующее УО.

Определения, которые были даны модифицированным операциям проекции и естественному соединению, в условиях отсутствия ограничений целостности представляются весьма естественными. Однако при наличии ограничений эта оценка может измениться, поскольку выполнение указанных операций может вызвать значительные побочные эффекты, что ограничивает их практическую применимость. В данной интерпретации “побочные эффекты” — это возникновение неопределенных значений при применении модифицированной операции естественного соединения.

В работе делается попытка предотвратить возникновение побочных эффектов. Для этого необходимо, чтобы несогласованная БД всегда имела f - U. В настоящее время нет систем, которые контролировали бы F-зависимости, за исключением F-зависимостей от ключа. При поддержке f - U также будут использоваться ключи, определенные F-зависимостями. Для этих целей воспользуемся модифицированным ограничением на чужой ключ [2].

Как известно [2,3], операция естественного соединения имеет экспоненциальную временную сложность, а получение УО относится к вычислительно трудным задачам. Для ускорения проверки уникальности ключа воспользуемся свойством ацикличности схемы [2]. В связи с этим используем редуктивный алгоритм Грэхема, после чего при необходимости

52

РИ, 1998, № 1

выделяем сильно связный блок [1], преобразуя схему, полученную декомпозицией, к блочно-ациклическому виду[ 1].

Оценим сложность попарного соединения и полного соединения всех отношений БД. Предположим, что в БД входит k отношений, каждое из которых содержит n кортежей. Тогда количество соединений Ef при полном соединении определяется формулой: Ef = nk, при попарном соединении количество соединений Ep вычисляется по формуле k (k-1)

E p = £ n2 = Mk-1) n2

: pn3 , где p =

1

k (k -1) 2

Если при оценке вычислительной сложности брать во внимание не только количество отношений, участвующих в соединении, то возможно, что сильно связный блок несколько увеличит вычислительную сложность, хотя в общем он дает значительное преимущество перед полным соединением цикли -ческой схемы.

4. Заключение

Рассмотренные задачи поддержки целостности данных выполняются на этапе как проектирования, так и ведения БД. Распределенное ведение БД требует проверки уникальности ключа во всех локальных отношениях, где существует ключевой атрибут, а именно проверки однозначности ключа на схеме слабоуниверсального отношения.

Литература: 1. ДедиковЭ.А.., БусликН.Н., ТанянскийС.С. Использование обобщенных операторов реляционной алгебры при ведении крупномасштабных баз данных. 1996. 8с. Деп. в ГНТБ Украины 16.04.96, N 957-Ук96. 2. Мейер Д. Теория реляционных баз данных. М.: Мир, 1987. 608 с. 3. Цикритзис Д, Лоховски Ф. Модели данных. М.: Финансы и статистика, 1985. 344 с.

Поступила в редколлегию 22.02.98 Танянский Сергей Станиславовоич, канд. техн. наук, доцент кафедры информационных систем и технологий в деятельности МВД Университета внутренних дел. Научные интересы: логическое проектирование и поддержка баз данных. Адрес: 310170, Украина, Харьков, ул. Блюхера, 22, кв. 159, тел. 65-47-52, 50-33-17.

Кобзев Игорь Владимирович, канд. техн. наук, старший преподаватель кафедры информационных систем и технологий в деятельности МВД Университета внутренних дел. Научные интересы: модели данных, распределенные неоднородные базы данных. Адрес: 310166, Украина, Харьков, ул. Новгородская, 44, кв. 19, тел. 30-71-75, 50-33-17.

Яковлева Ирина Александровна, канд. техн. наук, доцент кафедры информатики Университета внутренних дел. Научные интересы: структуры данных, универсальные алгебры. Адрес: 310058, Украина, Харьков, ул. Ромена Роллана, 7, кв. 40, тел. 43-75-14, 50-31-88.

УДК 519.713

EXPERT SYSTEMS USING FUZZY LOGIC

KRIVULIA G. F., RAMI J. MATARNEH

We propose offer some methods for human knowledge representation and making inferences in rule based expert systems, in terms of the theory of approximate reasoning developed by Zadeh, we extend our results on the rule based expert systems with a quantifier of the first and the second kind, these rules which satisfaction of sertain conditions in the antecedent portion.

1. Introduction

The essence of the fuzzy logic is that it underlies the modes approximately rather than exactly [1], derived from the fact that most modes or behavior of human reasoning are approximate in nature. The concept, which plays the main role in this logic, is the possibility distribution, which suggests that, ifwe have X, where Xis a collection of objects taking a value in a discourse U, then Пх is the fuzzy set of all possible values ofX, in symbolic notation Vu є U, Пх (u): U > [0,1], which means the possibility that X may take u as its value.

In general, the problem database in the expert systems consists of an attribute, an object and a value, so in the expert systems the rule is checked, if it is satisfied, then its value is added to the ED (explanatory database), taking into consideration that the rule considered to be satisfied, if the information in the database satisfies the antecedent

portion of the rule. The procedure is repeated until no more information can be added to the ED, after this procedure we apply other methods to obtain an approximate (acceptable for us) result.

2. Principal modes of fuzzy logic

It will be very helpful to take a short look at some of the principal modes of reasoning in the fuzzy logic [1].

1. Categorical representation: A is B and A is Cimplies that A is B and C which gives us A is (BaC), then A= MIN(B, C).

2. Syllogistic reasoning: Most A is B and Most B is C implies that Most2 A is B and C, with taking most as a quantifier named Q, then Q2 A is B and C, in symbolic form, where ''and'' stands for intersection, then Q2 A is (B a C), which gives Q2 A is Min (B,C), where Q2 is evaluated as an arithmetic value using the fuzzy arithmetic (the evaluation of Q will be discussed in section 4).

3. Dispositional reasoning: usually A is not B and usually A is not C, implies (2 usually -1) A is not B and not C, in symbols (2 usually-1) A is—(B) and — (C), then (2 usually-1) A is Min (—B a —C), which is equal to (2 usually -1) A is Min(—B,— C), usually evaluated as an arithmetic value, ''and'' — is a subtraction operator in the fuzzy arithmetic.

4. Qualitative reasoning: A is a if B is C and A is p if B is not C, implies that A is (a or p) if B is C (or not C), then A is (CaDaC v not CaDaP) is D, (here D<C and p>D), then A is Max[Min(C,D,C), Min(C,D, p)] is D which is equal to A is D if B is D.

For example: volume is small, if pressure is high and volume is large, if pressure is low, then volume is medium, if pressure is medium.

РИ, 1998, № 1

53

i Надоели баннеры? Вы всегда можете отключить рекламу.