Научная статья на тему 'Модели реляционных таблиц и информации табличного вида'

Модели реляционных таблиц и информации табличного вида Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
166
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗЫ ДАННЫХ / РЕЛЯЦИОННЫЕ ТАБЛИЦЫ / МОДЕЛЬ ИНФОРМАЦИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Брешенков А. В., Мин Т. Т.

В статье рассмотрены структурные модели реляционных таблиц и информации табличного вида. Выявлены их сходные черты и различия. Констатируется утверждение о том, что метод преобразования информации табличного вид в реляционные таблицы основывается на исключении в модели информации табличного вида свойств, которые отличают эту модель от модели реляционных таблиц.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Брешенков А. В., Мин Т. Т.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модели реляционных таблиц и информации табличного вида»

НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н.Э. ЬАУМЛНЛ

НАУКА и ОБРАЗОВАНИЕ

Эл JVa ФС 77 - 48211. Государственная регистрация №(I4212Ü0025. ISSN 1994-0408

электронный научно-технический журнал

Модели реляционных таблиц и информации табличного вида 77-48211/425211

# 07, июль 2012 Брешенков А. В., Мин Т. Т.

УДК 681.3.07

Россия, МГТУ им. Н.Э. Баумана breshenkov@rambler.ru

Введение

Вопросам проектирования реляционных баз данных (РБД) посвящен ряд теоретических и практических исследований [1-5, 8]. Однако возможности существующих методов и средств проектирования РБД далеко не исчерпаны. В частности представляют интерес методы проектирования РБД на основе анализа существующей информации.

В работах [6, 9, 8, 11] обоснована актуальность разработки методов и средств автоматизированного преобразования информации табличного типа (ИТВ) в реляционные таблицы (РТ). Актуальность преобразования связана с тем, что, с одной стороны, при наличии информации в ИТВ возможна формализация процесса проектирования реляционных баз данных, а, с другой стороны, расточительно не использовать существующие данные и возможности РБД. Предлагается разработать метод, который основываясь на разрабатываемых алгоритмах, преобразует модель ИТВ в модель РТ. Использование метода обеспечит использование ИТВ в РБД. В статье рассмотрены модели РТ и ИТВ.

1. Укрупненная модель реляционных таблиц

Практически во всех работах, посвященных РБД, сформулированы требования к РТ. Однако эти требования, как правило, представляют собой перечисление свойств, которыми должны обладать таблицы. Требования не формализованы, да они и не могут быть формализованы, т.к. РБД проектируются на основе схем отношений. Например, схема отношения "Студент" может иметь вид: "Студент" = (Фамилия, Имя, Отчество, Дата рождения, Дата поступления, Адрес,..., Средний балл). Требования же предъявляются к данным, а данных во многих случаях еще и нет. Они появятся потом в процессе

эксплуатации БД и может оказаться, что сформулированные на начальных этапах проектирования требования к РТ не удовлетворяются. В частности, отталкиваясь от схемы отношения "Студент", вполне можно предположить, что сочетание Фамилия, Имя, Отчество вполне подходит для первичного ключа. Однако, как показывает опыт, даже в рамках одного факультета, нередко встречаются полные тезки. А основным требованием к первичному ключу является его уникальность.

Нередко исходная информация присутствует в виде ИТВ. В этом случае ситуация существенно меняется в лучшую сторону. Ведь на основе реальных данных вполне возможно формализовать требования к ним.

В работе [7] описана формальная модель РТ. Основные ее черты следующие. Реляционная таблица (RT) представляется множеством RT={Z, D},

где Z — множество заголовков, D - множество данных.

z = {zh ..., Zi, ..., zn}, i = 1, n; n > = 1, (1)

где n - степень множества заголовков.

Должно быть обеспечено условие zi Ф zm , i =1, n ; m = 1, n; i Ф m, (2)

где n — степень множества заголовков, т.е. недопустимо совпадение заголовков.

D = {SD}, где SD — множество строк данных. (3)

SD = {SD1, ..., SDi, ..., SDn}, i = 1, n; n >> 1, (4)

где n - мощность множества строк данных.

SD= {EDU, ..., EDij, ..., EDk}, j = 1, k; k >= 1,

где k - степень множества i-ой строки данных, EDij — элемент данных.

Недопустима ситуация, когда внутри таблицы данных могут встретиться заголовки, т.е. должно выполнятся условие:

SD, Ф zj, i = 1, n; n >> 1; j = 1, k; k >= 1, (5)

где n - мощность множества строк данных, k - степень множества заголовков. Для реляционных таблиц выполняется правило:

(VED) (ED ESD) (3z(Z EZ) (Z <->ED)) (6)

Т.е. каждому элементу данных соответствует только один заголовок.

(VED) (EDESD) (3(TED) (ED <->TED)), (7)

где TED = string V integer V datetime V real V logical. Т.е. каждому элементу данных соответствует определенный тип данных.

В реляционных таблицах обязательно выполнение следующего требования:

ТЕБи =, ..., = ТЕИа =, ..., = ТЕБ^

ТЕВ) =, ..., = ТЕИу =, ..., = ТЕБ,

ТЕБ1к =, ..., = ТЕБ-к =, ..., = ТЕБпк, г = 1, п;п >> 1) = 1, к; к > = 1, (8)

где п - мощность множества строк данных, к - степень множества 1-ой строки данных; ЕВ) - элемент данных. Другими словами, значения типов данных одного столбца должны совпадать.

Недопустима ситуация, когда £Вг = 8В), г = 1, п;) = 1, п; г Ф), (9)

где п - мощность множества данных. Т.е. невозможно полное совпадение строк данных.

Однако в данном случае отражены не все свойства реляционной модели данных (РМД), которые в числе прочих предполагается взять за основу при разработке метода преобразования ИТВ в РТ.

Несмотря на достоинства этой модели, она не в полном объеме отражает особенности РТ и соответственно не может в полной мере служить исходной формализацией для метода преобразования.

В реляционной модели данных [4] не предусмотрено наличие первичных ключей.

Пусть Щ = {ЕИа, ..., ЕБ), ..., ЕЛд}, ) = 1, к; к >= 1, ( 10)

где 8Вг - 1-я строка данных множества, к - степень множества, ЕВ) - элемент данных.

Тогда должен быть найден такой заголовок 21 ^ — ЕВ)), чтобы выполнялось выражение:

ЕБц . ф ЕВ) ф. ЕБп , где п - мощность множества ( 11)

Таким образом, в таблице должен присутствовать такой столбец, все значения которого бы отличались. Такой столбец можно использовать в качестве первичного ключа.

Кроме того, в качестве первичного ключа могут использоваться сочетания атрибутов таблицы.

В реляционной модели данных не должно быть пустых заголовков:

21 Ф 0 ( 12)

В реляционной модели данных не должно быть пустых строк:

8Вг Ф 0 ( 11)

В реляционной модели данных содержимое никакого столбца не может использоваться

как подзаголовки. ( 13) В реляционной модели данных не должно быть сочетаний различного типа подзаголовков. (14)

2. Укрупненная модель ИТВ

Если в предыдущем параграфе рассматривалось целевая модель данных РТ, то здесь разговор пойдет об исходной модели, которую необходимо преобразовать в форму РТ - модель ИТВ.

Модель ИТВ в известной литературе, как правило, не рассматривается. В работе [11] представлена неполная формализованная модель ИТВ, которая с модификациями может быть принята в качестве базовой для решения задач преобразования ИТВ в РТ. Рассмотрим эту модель.

Информация табличного вида (ИТВ) представляется множеством БТ = (Ъ, Б), где Ъ - множество заголовков ИТВ, Б - множество данных, соответствующим заголовкам. (15)

2 = {21, ..., 22, ..., 2п}, I = 1, п; п >= 1, (16)

где п - степень множества заголовков.

Допустима ситуация, когда

= 2т, I = 1, п ; т = 1, п; IФ т , (17)

где п - степень множества заголовков, т.е. возможно полное совпадение заголовков.

В данных табличного вида возможны подзаголовки 1-го уровня, что формально выглядит следующим образом.

Ъ, = (РЪп, ..., РЪу, ..., РЪ1к}, ] = 1, к; к >= 2, (18)

где к - степень множества подзаголовков 1-го заголовка.

Ър= (РЪр1, ..., РЪрЬ ..., РЪрт}, 1 = 1, т; т >= 2, (19)

где т - степень множества подзаголовков р-го заголовка.

Допустима ситуация, когда РЪу = РЪрг. (20)

В данных табличного вида возможны подзаголовки 2-го уровня, что формально выглядит следующим образом.

РЪу = (РРЪуь РРЪут, РРЪ^}, т = 1, £ { >= 2, (21)

где { - степень множества подзаголовков 2-го уровня у-го подзаголовка 1-го уровня.

РЪр1 = (РРЪрц, РРЪрЬ PPЪptg}, г = 1, я; я >= 2, (22)

где я - степень множества подзаголовков 2-го уровня р1-го подзаголовка 1 -го уровня

Допустима ситуация, когда

РРЪут= РРЪр1т. (23)

Теоретически в данных табличного вида может быть больше уровней подзаголовков.

На рис. 1 приведен реальный пример таблицы ИТВ с подзаголовками.

№ п/п Д"а 1 Город Продавец Заказчик Сегмент 1 Количество Тип оборудования Тип конт-1 Цена

Регион выдали (организация) лифтов Купе кабины Лебедка С-ма Двери Вызывная и Устр-ва Другое ракта в тыс. руб. или $

предложения управ лен. шахты |Иказн аппа безоп-ти (М. (М, Ц

0 т 1 т 1)2.01.ат 3 т 4 т 5 т 6 т 7 т 9 т 8 ж 10 т 11 т 12 т 13 т 14 т 15 т 16 т 17 т

Е2 565-1™ 10.01.01 шк Шварев С. Частное лице 2 1 фотореверс 1 750

икр: вгва-мкп 10.01.01 шк Алпатова Централ .те 3 1 Бизнес 13М"Р1-М КШ ЛуГ Ств.ДШ Бизнес ВКП 507,00

М8Й Е2570-М8В 10.01.01 шк Алпатова Централ .те 3 1 Люкс 131ДВ-М Ств.ДШ Люкс вкл 1М. 548,00

МШ Е2 571-1™ 10.01.01 шк Алпатова Централ .те 3 1 Бизнес Бизнес НЕ ВКП 84,00

МЕР: В 572« Я 10.01.01 шк Алпатова Централ .те 3 1 Люкс Люкс НЕ ВКЛ 148,00

М8Й Е573-М8В 11.01.01 шк Козловская ОАО 5 2 Люкс 131ДВ-М К1М-1 Ств.ДШ Люкс ВКП 1М. 767,00

МШ 11.01.01 шк Козловская ОАО 5 2 Люкс 13И"Р;-М Ки»-1^ Ств.ДШ Люкс ВКП 1 307,00

МЕР: £2575-1™ 11.01.01 шк Шварев С. Госконрезе 2 2 Бизнес Ств.ДШ Люкс НЕ ВКП 355,00

М8Й Е 576-1™ 12.01.01 шк Алпатова Централ .те 2 1 Стандарт 131ДВ-М К1М-1 Ств.ДШ Бизнес ВКП 1М. 257,00

МШ Е2 577-1™ 16.01.01 шк Алпатова ГНП 5 1 Бизнес 13И"Р;-М К1М-1 Ств.ДШ Бизнес ВКП 324,00

МЕР: Е2 575-1™ 16.01.01 шк Козловская Мпнистер.к 2 3 Люкс 13М"Р|-М МСЗ-220 Ств.ДШ Люкс ВКП 1 232,00

М8Й Е 578-1™ 22.01.01 шк Алпатова "Импексбан 3 1 Люкс Люкс НЕ ВКП М+Ц 137,00

МШ Е2550-М5Р! 22.01.01 шк Козловская 1Лгнистер.ф 2 1 Люкс Люкс НЕ ВКП 120,00

МЕР: IS.01.01 РУ-2 Левин В. "Рособорон 3 3 Люкс 13\ДР: К1М-В Люкс ВКП 550,00

М8Й Е 552-1™ 25.01.01 РУ-2 Левин В. 4 2 Бизнес 13Ш К1М-1 Ств.ДШ Бизнес ВКП 1М. 430,00

МШ Е2 553-1™ 26.01.01 РУ-2 Левин В. МГУ ПС 2 2 Стандарт К1М-В Ств.ДШ Стандарт ВКП 864,00

МЕР: Е2 554-1™ 08.01.01 РУ-3 Зензина Е. ЗАО 3 1 Бизнес 13\ДР: КШ Пластик Бизнес нет 400,00

Рис. 1. Пример таблицы ИТВ с подзаголовками

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Здесь заголовок "Тип оборудования" включает в себя 7 подзаголовков, заголовок "Цена" включает в себя 2-а подзаголовка.

Б = (ББ, Ъ}, где ББ - множество строк данных. (24)

Такого рода представление Б допускает наличие нескольких заголовков и подзаголовков 1-го и 2-го уровней, расположенных в области данных.

В том числе допускается наличие заголовков и подзаголовков, расположенных до, после и между строк данных. На рис. 2 приведен реальный пример таблицы ИТВ с заголовками внутри области данных. Таковыми являются строки 1 и 9 и др. Кроме того, на рисунке представлен внутренний подзаголовок более высокого уровня "Собрать свой компьютер".

Рис. 2. Пример таблицы ИТВ с заголовками внутри области данных

SD = {SDi, ..., SDi, ..., SDn}, i = 1, n; n >> 1, (25)

где n - мощность множества строк данных.

SDi = {EDii, ...,EDij, ..., EDik}, j = 1, k; k >= 1, (26)

где k - степень множества элементов данных i-ой строки данных; EDij - элемент данных. Для информации табличного вида должно выполняться следующее правило:

(VED) (ED G SD) (3 z (z e Z) (zoED)) V (3 (PZ)) (z e PZ) (PZ ^ ED) V (3 (PPZ)) (PPZ e

PZ) (PPZ ^ ED) (27)

Т.е. каждому элементу данных соответствует заголовок или подзаголовок 1-го или 2-го уровней и наоборот.

(VED) (ED G SD ) (3TED (TED G T(ED))), (28)

где TED = string V integer V datetime, где T(ED) - тип ED. Но каждому элементу данных соответствует какой-либо тип данных.

В общем случае:

ТЕВцф, ..., фТЕВгф, ..., фТЕВп1

ТЕВцф, ..., фТЕВ)ф, ..., фТЕВп)

ТЕВ1кф, ..., фТЕВгкф, ..., фТЕВпк, г = 1, п; п >> 1;) = 1, к; к >= 1, (25) где п - мощность множества строк данных, к - степень множества элементов 1-ой строки данных. Другими словами, значения типов данных одного столбца могут не совпадать.

Допустима ситуация, когда = , 1 = 1, п ; ] = 1, п; 1 Ф} , (26)

где п - мощность множества данных, т.е. возможно полное совпадение строк данных.

В модели ИТВ могут быть пустые заголовки:

21 = 0 (27)

В модели ИТВ могут быть пустые строки:

8Вг = 0 (28)

В ИТВ содержимые столбца могут использоваться как подзаголовки таблиц. (26)

В ИТВ могут быть сочетания различного типа подзаголовков (27)

Несмотря на некоторое сходство модели таблиц ИТВ и модели РТ, в них имеются существенные различия.

Сравним выражения для РТ и ИТВ.

1. Выражения (17-24) для ИТВ противоречат выражению (2) для РТ.

2. Выражения (27-28) для ИТВ противоречат выражению (5) для РТ.

3. Выражение (28-27) для ИТВ противоречат выражению (12-14) для РТ.

4. Выражение (25) для ИТВ противоречат выражению (8) для РТ.

5. Выражение (26) для ИТВ противоречат выражению (9) для РТ.

Кроме того, в исходной модели РТ не предусмотрено наличие первичного ключа. Соответственно отсутствуют требования к первичному ключу.

Основной задачей метода преобразования ИТВ в РТ и является разработка средств, которые бы позволили ликвидировать указанные различия в их моделях.

Заключение

В статье рассмотрены структурные модели реляционных таблиц и информации табличного вида. Выявлены их сходные черты и различия. Констатируется утверждение о том, что метод преобразования информации табличного вид в реляционные таблицы основывается на исключении в модели информации табличного вида свойств, которые отличают ее от модели реляционных таблиц.

Литература

1. Монографии, брошюры и т.п.:

1. Ульман Д., Уидом Д. Введение в системы баз данных: Пер. с англ. - М.: Лори,

2000. - 319 с.

2. Гэри Хансен, Джэймс Хансен. Базы данных: разработка и управление: Пер. с англ. - М.: Бином, 1999. - 699 с.

3.Агальцов В.П. Базы данных. - М.: Мир, 2002. - 375 с.

4.Ахаян Р., Горев А., Макатирипов С. Эффективная работа с СУБД. - СПб.: Питер, 1997. - 704 с.

5.Хоменко А.Д., Цыганков В.М, Мальцев М.Г. Базы данных: Учебник для высших учебных заведений / Под ред. Проф. А.Д. Хомоненко - 6-е изд. - М.:Бином-Пресс.:СПб КОРОНА-Век, 2007. - 736 с.

6. Брешенков А.В., Гудзенко Д.Ю., Казаков Г.И. Проектирование реляционных баз данных на основе информации табличного типа. Учебное пособие- М.: Изд-во МГТУ им. Н.Э. Баумана, 2009 - 150 с.

7. Брешенков А.В. Методы решения задач проектирования реляционных баз данных на основе использования существующей информации табличного вида. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2007. - 154 с.

8. Брешенков А.В., Балдин А.В. Анализ проблемы проектирования реляционных баз данных на основе использования информации табличного вида и разработка модели методики проектирования. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2007. - 150 с.

2. Периодические издания:

9.Аграновский А.В., Арутюнян Р.Э, Хади Р.А. Современные аспекты проблемы

поиска в текстовых базах данных // Телекоммуникации. - 2003. - №3. - С. 25-23.

10. Брешенков А.В. Неформальная постановка проблемы преобразования информации табличного вида в файлы баз данных // Сб. трудов АУ МВД России "Актуальные вопросы технологий в деятельности органов внутренних дел". - М., 2004. -С. 55-70.

11. Брешенков А.В., Бараков Д.Д. Вопросы преобразования электронных таблиц в таблицы реляционных баз данных // Современные информационные технологии: Сб. трудов каф., посвященный 175-летию МГТУ им. Н.Э. Баумана. - М.: Эликс +, 2004. - С. 44-50.

SCIENTIFIC PERIODICAL OF THE BAUMAN MSTÜ

SCIENCE and EDUCATION

EL JV® FS 77 - 4821 1. №0421200025. ISSN 1994-0408 electronic scientific and technical journal

Models of relational tables and information in tabular form 77-48211/425211 # 07, July 2012

Breshenkov A.V., Min Thet Tin

Russia, Bauman Moscow State Technical University

breshenkov@rambler.ru

Structural models of relational tables and information in tabular form were considered in this article. Their resemblant and distinct features were revealed. It was stated that method of transformation of information in tabular form into relational tables was based on exclusion of information that differ a tabular form from a relational tables from a model.

Publications with keywords: data bases, relational tables, relational database, information table form, database design, model of the relational tables, model of the information table form Publications with words: data bases, relational tables, relational database, information table form, database design, model of the relational tables, model of the information table form

References

1. Ullman J.D., Widom J. First course in database systems. Englewood Cliffs, Prentice-Hall, 1997. (Russ. ed.: Ul'man D., Uidom D. Vvedenie v sistemy baz dannykh. Moscow, Lori Publ., 2000. 319 p.).

2. Hansen G.W., Hansen J.V. Database Management and Design. Englewood Cliffs, Prentice-Hall, 1995. 582 p. (Russ. ed.: Khansen G., Khansen Dzh. Bazy dannykh: razrabotka i upravlenie. Moscow, Binom Publ., 1999. 699 p.).

3. Agal'tsov V P. Bazy dannykh [Databases]. Moscow, Mir Publ., 2002. 375 p.

4. Akhaian R., Gorev A., Makatiripov S. Effektivnaia rabota s SUBD [Effective work with DBMS]. St. Petersburg, Piter Publ., 1997. 704 p.

5. Khomenko A.D., Tsygankov V.M, Mal'tsev M.G. Bazy dannykh: Uchebnik dlia vysshikh uchebnykh zavedenii. 6-e izd. [Databases: A textbook for higher educational institutions. 6th ed.]. Moscow, Binom-Press Publ., St. Petersburg, Korona-Vek Publ., 2007. 736 p.

6. Breshenkov A.V., Gudzenko D.Iu., Kazakov G.I. Proektirovanie reliatsionnykh baz dannykh na osnove informatsii tablichnogo tipa [Relational database design based on the tabular type information]. Moscow, Bauman MSTU Publ., 2009. 150 p.

7. Breshenkov A.V. Metody resheniia zadachproektirovaniia reliatsionnykh baz dannykh na osnove ispol'zovaniia sushchestvuiushchei informatsii tablichnogo vida [Methods for solving

problems of designing relational databases using the existing tabular form information]. Moscow, Bauman MSTU Publ., 2007. 154 p.

8. Breshenkov A.V., Baldin A.V. Analizproblemyproektirovaniia reliatsionnykh baz dannykh na osnove ispol'zovaniia informatsii tablichnogo vida i razrabotka modeli metodiki proektirovaniia [Analysis of the problem of designing a relational database using tabular form information, and development of the model for design techniques]. Moscow, Bauman MSTU Publ., 2007. 150 p.

9. Agranovskii A.V., Arutiunian R.E, Khadi R.A. Sovremennye aspekty problemy poiska v tekstovykh bazakh dannykh [Modern aspects of the problem of searching in text databases]. Telekommunikatsii, 2003, no. 3, pp. 23-25.

10. Breshenkov A.V. Neformal'naia postanovka problemy preobrazovaniia informatsii tablichnogo vida v faily baz dannykh [The informal setting of the problem of transformation of tabular form information into database files]. "Aktual'nye voprosy tekhnologii v deiatel'nosti organov vnutrennikh del". Sb. tr. AUMVD Rossii ["Topical issues of technology in the activities of the internal affairs bodies". Academy of Management of the Interior Ministry of Russia. Coll. works]. Moscow, 2004. pp. 55-70.

11. Breshenkov A.V., Barakov D.D. Voprosy preobrazovaniia elektronnykh tablits v tablitsy reliatsionnykh baz dannykh [Problems of spreadsheets converting into tables of relational databases]. Sovremennye informatsionnye tekhnologii. Sb. tr. [Modern information technology. Coll. works]. Moscow, Eliks+ Publ., 2004. pp. 44-50.

i Надоели баннеры? Вы всегда можете отключить рекламу.