Научная статья на тему 'Расширенные функциональные зависимости в реляционных базах данных'

Расширенные функциональные зависимости в реляционных базах данных Текст научной статьи по специальности «Математика»

CC BY
261
15
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Вельмисов Александр Петрович

Данная статья о проектировании реляционных баз данных и месте функциональных зависимостей в данном процессе. Так как функциональные зависимости играют ключевую роль применительно к избыточности и выбору подходящих схем, автором исследуется степень, до которой они сохраняются, в случае, когда функциональные зависимости фаззифицированы

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Расширенные функциональные зависимости в реляционных базах данных»

Асм= { СЩУ), Геи %

которая включает в себя следующие компоненты: Си(У)= М<Уг), ... > АП(УП) | 0=1, 2, ...} - множество ИМУК, ассоциированных с множеством вершин(У) УК-графа; Рси= (А^ А2,... , А„) | п, т = 1, 2, ... } — множество алгебраических операций над множеством ИМУК

Си(У).

Множество алгебраических операций включает в себя:

1. Операцию последовательного изучения

ИМУК:

Ат А2; ТК1 (см. рис. 2);

2. Операцию а-дизъюнкции:

А) (А2УА3) ТК2 (см. рис. 3);

и

3. Операцию независимого изучения ИМУК: А, [А2 А3] А4; ТКЗ (см. рис. 4);

4. Операцию а-цикпа:

{А^ А2; ТК4 (см. рис. 5);

а

5. Операцию сазе-дизъюнкции:

{ А,} ( А2 У (А3У0)) А4; ТК5 (см. рис. 6);

а V р а р

6. Операцию «условие доступности вершины»: <список вершин> <оператор> (см. рис. 8);

А] [А2 |А4 А3А5] Аз [А2А5 А6Ц А7; ТК7.

1 2 2 3 3 1

УДК 004.896 А. П. ВЕЛЬМИСОВ

Вводится ряд алгебраических операций над алгебраическими выражениями, с помощью которых осуществляется построение и преобразование УК-графа. Это операции: поглощения -abs (от англ. «absorption» - поглощение); наложения - lay (от англ. «lay on» -наложить); удаления - del (от англ. «delete» - удалить); замещения - rpl (от англ. «RePLace» - заменить).

Результаты данной работы нашли отражение в Компьютерной Системе Обучения Проектной Деятельности - КСО ПД, которая позволяет строить ПД-граф. УК-граф, производные от ПД-графа аналитические графы и проводить обучение инженеров проектной деятельности. Также был разработан комплекс программ для компьютерного тестирования — УСА ТИК 2.004 (адрес в INTERNET: www.usatic.narod.ru).

Афанасьев Александр Николаевич, кандидат технических наук, доцент кафедры «Вычислительная техника» УлГТУ. Занимается проблемами организации вычислительных процессов и обучения в САПР.

Макашов Алексей Вячеславович, аспирант кафедры «Вычислительная техника» УлГТУ\ магистр техники и технологий. Занимается проблемами компьютерного обучения, имеет публикации по исследованию методов и средств обучения проектной деятельности в

САПР.

РАСШИРЕННЫЕ ФУНКЦИОНАЛЬНЫЕ ЗАВИСИМОСТИ В РЕЛЯЦИОННЫХ БАЗАХ ДАННЫХ

Данная статья о проектировании реляционных баз данных и месте функциональных зависимостей в данном процессе. Так как функциональные зависимости играют ключевую роль применительно к избыточности и выбору подходящих схем, автором исследуется степень, до которой они сохраняются, в случае, когда функциональные зависимости фаззифицированы.

Функциональные зависимости

Одной из интересных сторон реляционной модели является её математическая природа и способность формально оперировать различными объектами, в том числе и процессами проектирования баз данных. Этот вопрос был подробно изучен еще в 70-х годах, причём особое внимание было уделено проблеме избыточности, где основной задачей является удаление ненужного дублирования данных на этапе проектирования

базы. Это мотивировано проблемами, порождаемыми избыточностью при обновлении данных. Например, когда «избыточные» данные обновляются, необходимо быть уверенным, что все «копии» изменились, в противном случае база становится противоречивой. Работы на эту тему в основном освещают формы избыточности, связанные присутствием свойств именованных зависимостей, наиболее известных как функциональные зависимости.

© А. П. Вельмисов, 2004

52

Функциональная зависимость X —> У между множествами атрибутов X и У отношения Я выражает ограничение реального мира, согласно которому одно и только одно значение У соответствует каждому значению X (таким образом, это функция между X и У, чей график дан расширением Ю. Очевидно, что функциональная зависимость X —> У потенциально несёт некоторую избыточность, за исключением того случая, если Х-значения уникальны в Я (Х - тогда ключ). В соответствии с функциональными зависимостями отношение Я удовлетворяет различным нормальным формам, то есть ограничениям целостности согласно их функциональным зависимостям. В случае, когда Х-ключ, проверка функциональных зависимостей X —> У не требует какой-либо дополнительной специальной программы (СУБД проверит уникальность Х-значений при вставке в Я{Х,Уу2), и в случае, когда изменение У-значения связано с данным X-значением, только один кортеж должен быть доступен и изменён). Это составляет главный интерес в теории нормализации с практической точки зрения.

Было показано, что каждый юниверсум может быть смоделирован как:

1) множество отношений в 3 НФ без потерь зависимостей (так как зависимости, порождён-ные ключами, также прямые или транзитивны);

2) множество отношений в НФ Баейса-Кодда, но некоторые зависимости могут быть потеряны.

Преобразование схемы в другие виды основаны на теореме декомпозиции, утверждающей, что отношение связанное с функ-

циональной зависимостью ^ —> У, эквивалентно их двум проекциям В\Х, У] и R >2 ].

Было много попыток расширить функциональные зависимости до так называемых нечётких функциональных зависимостей (НФЗ) путём представления некоторой градации, связанной с использованием нечётких множеств, и/или неточности благодаря как неполным данным или представлению грубого словаря (взамен градации) в доменах ([Bhuniya, Niyogi 1993], [Chen, Kerre, Vandenbulcke 1995], [Cubero, Vila 1994], [Cubero, Medina, Pons, Vila 1997], [ Kiss 1991], [Liu 1994 ], [Raju, Majumdar 1988], [Saxena, Tyagi 1995]). В данной статье рассматривается случай, когда данные точно известны, а главной целью является исследование расширения, для которого избыточность (и управление обновлениями) остается вопросом в контексте двух видов расширений.

Ослабление эквивалентности

Первый тип расширения заключается в замещении строгой эквивалентности сходством, которое интуитивно стремится наложить ограничение не только, когда Х-значения равны, но также и когда они «близко» друг от друга. Таким образом, очевидно, что ограничение строже, чем обычная функциональная зависимость, где выбор налагает эквивалентность на Y-значения, в случае эквивалентности Х-значений (функциональное отношение между X и Y).

Были предложены два основных вида приближения для определения типа расширенных функциональных зависимостей.

В первом [Cubero, Vila 1998], формула расширения:

X—>Yis valid onRoVtltleR,

¡1 « х(А X, ах) >(й .7, а.У) > р

у которой нет очевидной интерпретации до тех пор, пока аир отчасти произвольные границы.

Более того, это приближение не сохраняет идею функции между X и У-значениями, поскольку различные У-значения могут быть соотнесены с теми же Х-значениями.

Во втором приближении [Я^'и, Ма^иггкЗаг 1988], постоянная формула расширена в канонической форме:

X —>У и уаНсЬпЯ Щ с2 е Д

\i*x(tlX,t2X)

\i*y(1lY,tZY)>P

R-G

обозначает импликацию Ресчера-

R-G

где

Гейнза: а => Ъ = 1 г/ а < Ь, 0 иначе и ц = В

R-G

обозначает истинное значение функции градуированного сходства относительно домена В, который принят как рефлексивный и симметричный. Эта формула может быть интерпретирована как сходство на У, по крайней мере, сходно на X. Обычные свойства, правильные для функциональных зависимостей, также остаются для этого типа нечётких функциональных зависимостей:

(у х V ч у) рефлексивность ^ — ;

аддитивность (X —> У => Х2 —> У2)

транзитивность (X —» У and У—> Z => X ~> Z)

объединение (X —> У and X —> Z=>X ~> YZ)

декомпозиция

X YZ^ Z —> У and X Z) п с евдо-тр анз ити в но сть

{X —> Y and YW —> Z => XW Z).

Более того, если предполагается сильная рефлексивность сходных отношений, то есть ц = (а,Ь) = 1 а - Ь, достоверность нечёткой

функциональной зависимости X » У влечёт за собой регулярную (обычную) функциональную зависимость X -> У ш

Обычная теорема декомпозиции выдерживает и отношение, где нечёткая функциональная

зависимость ^ ^ может быть безболезненно декомпозирована на две проекции К[Х,У] и

Я[Х, Щ

Фактически, оказывается, что такие функциональные зависимости состоят из двух частей: регулярные функциональные зависимости, которые направлены на избыточность и ограничения, когда Х-значения отчасти сходны, что не совсем связанно с избыточностью. Как следствие, управление обновлениями теряет хорошее свойство - ненужность дополнительной программы, которая при вставке кортежа меняет У-значение, связанное с X. Очевидно, что вопрос нечётких функциональных зависимостей связан со сходством и далёк от уникальности ключа, и, таким образом, не может быть представлен без дополнительных программ.

Изменение степени детализации

Второй тип расширения основан на изменении степени детализации представленных значений. Чтобы упростить представление, мы ограничим себя случаем, когда X и У - атомарные атрибуты. Замысел в трансформировании начальной формулы в:

X У верно на К <=> VП е х (й .X)

где Ту, - изменение, выражающее изменение

степени детализации в начальном домене Э, основанном, например, на кластеризации. Важным является то, что надо сохранить понятие функционального отношения между X и У (после трансформации). Этого типа свойство релевантно только когда группы кортежей и полученное свойство имеют ясное значение. Чтобы получить полнозначные группы, надо использовать лингвистические метки (низкий, средний и т. д.), которые выражают понятие предпочтения.

Интерес состоит в том, чтобы избежать ввода произвольных точных границ при определении кластеров (групп). Тогда нечёткие функциональные зависимости могут использовать уровни предпочтения в добавок к функциональным

отношениям между метками Ех, ассоциированными с X, и Еу, ассоциированными с У, через

определение нечётких функциональных зависимостей как

X ~>- У верно на Я со

где \лЕ (а) - степень принадлежности своей

метке (благодаря трансформации ¿>) и Е0(а) -

метка, ассоциированная со значением домена О.

Таким образом, выражено специфичное ограничение для каждого кортежа (это не было принято относительно функциональных зависимостей, которые отвечают за связность кортежей, соотносящихся с остальными), согласовывая, таким образом, достоверность пары преобразований т ,т; (когда принадлежность нечёткому множеству - лингвистическая переменная -ассоциированная с У большим или эквивалентным нечёткому множеству ассоциированному X). Итак,, мы получили семантику правила, выражающего, что 1.У тем более принадлежит

Еу , когда X принадлежит Ех .

Если мы приняли, что метки различных типов разделений (треугольные или трапециевидные) пересекаются на одной и той же высоте, значение может принадлежать (рассматривая плавный переход) двум меткам. Тогда понятие функции между X и У становится трудноуловимо (каждый кортеж размывается на 4 кортежа) и получается, что вид моделируемого свойства не представляет интереса в случае континуума значений на X и У.

Из данного множества лингвистических меток Д (отвеч. В), ассоциированных с доменом X (отвеч. У), мы рассматриваем одно из свойств, связанное с парами (]Ап В Д на основе следую-

щей семантики:

если Х.Х и 1.'Х переписаны также путём преобразования х , тогда г.У и г'.'У переписаны также с помощью т '.каждый кортеж удовлетворяет

правилу, «чем больше 1Хв (¡.я) Д, тем больше

Можно смоделировать этот тип свойства так называемой частичной нечёткой функциональной зависимости (~> р):

(X, Д.) ~>р (7, В])удовлетворяет на Я о V? еЯ, [14 (иХ) =>я_с \хв (г.У),

в которой правильность этого правила обеспечивается функциональным отношением между

А, и В:.

Заключение

Были рассмотрены два аспекта расширенного понятия ФЗ, которые имеют точку соприкосновения во введении постепенности с помощью нечётких множеств. Говоря о ФЗ, два возможных ослабления были изучены с целью опреде-л ить соответствующие значен ия кон цепци и

НФЗ.

Первое расширение основано на ослаблении эквивалентности в ФЗ. Семантически - это «наиболее похожим Х-значениям должны соответствовать У-значения». Было показано, что регулярные ФЗ инкапсулированы в расширенные ФЗ, которые сохраняют некоторые известные результаты, такие как теорема декомпозиции, и устанавливают актуальные связи с избыточностью.

Второе расширение направлено на моделирование свойств, формат которых представляет аналогию с ФЗ, и обычное определение ФЗ модифицировано значениями двух преобразований, выражающих изменение степени детализации начальных доменов. Полученные кластеры - это нечёткие множества. Вводится понятие частичной НФЗ, которая определена как постепенное свойство, ограниченное одним из подмножеств домена атрибутов, составляющее левую часть зависимости. Этот вид расширенной ФЗ явно не связан с избыточностью.

Таким образом, расширенные ФЗ, рассмотренные в данной статье, не подходят для выра-жения избыточности и, таким образом, они не связаны с проектированием БД. Они могут быть

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

рассмотрены как ограничения на юниверсуме. Однако они могут быть использованы для синтеза знаний в контексте процессов DataMinig са с целью выявления нечётких свойств. Использованная здесь импликация Rescher-Gaines, чьё истинное значение истинно или ложно, может быть смягчена по Godel, Goguen, Lukasiewicz, где результат получается не .нулевым, когда заключительная часть менее истинна, чем предпосылка.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Ярушкина, И. Г. Нечёткие нейронные сети (Часть 1) // Новости ИИ. - 2001. - N 2-3.

2. Ярушкина, Н. Г. Нечёткие нейронные сети (Часть 2) // Новости ИИ. - 2001. - N 4.

3. Bosk, P., Pi vert, О. Extended functional dependences, redundancy and update management//

EUFIT-98.

4. Cubero, J. C., Cuenca, F., Vila, M. A. // EUFIT-98.

5. R. Fuller. Hybrid systems. Tutotium. http: //www. abo. fiA fuller/

6. Zadeh, L.A. Toward a theory of fuzzy information granulation and .its centrality in human reasoning and fuzzy logic. Fuzzy sets and systems, 1997, Vol. 90,N.2.

Велъмисов Александр Петрович, аспирант кафедры «Информационные системы» УлГТУ\ Имеет публикации в области генетических алгоритмов, нейронных сетей, нечёткой логики.

i Надоели баннеры? Вы всегда можете отключить рекламу.