Научная статья на тему 'Алгоритм для оценки сложности реляционной базы данных'

Алгоритм для оценки сложности реляционной базы данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
418
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЛЯЦИОННАЯ БАЗА ДАННЫХ / АЛГОРИТМ / СЛОЖНОСТЬ / RELATIONAL DATABASE / ALGORITHM / COMPLEXITY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вершинникова Л.А.

Рассмотрена проблема сложности реляционной базы данных. Проанализирован существующий алгоритм оценки сложности. Предложена его модификация с учетом наличия сложных связей в базах данных, используемых в ракетно-космической отрасли.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM FOR THE ASSESSMENT OF COMPLEXITY OF THE RELATIONAL DATABASE

We considered a problem of complexity of the relational database. We analyzed the existing complexity assessment algorithm. and create a new algorithm for determination of complexity of the database. We proposed a modification of the algorithm taking into account the presence of complex links in databases used in the rocket and space area.

Текст научной работы на тему «Алгоритм для оценки сложности реляционной базы данных»

Актуальные проблемы авиации и космонавтики - 2017. Том 2

УДК 004.021

АЛГОРИТМ ДЛЯ ОЦЕНКИ СЛОЖНОСТИ РЕЛЯЦИОННОЙ БАЗЫ ДАННЫХ

Л. А. Вершинникова Научный руководитель - Е. П. Моргунов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: vershinnikova@yandex.ru

Рассмотрена проблема сложности реляционной базы данных. Проанализирован существующий алгоритм оценки сложности. Предложена его модификация с учетом наличия сложных связей в базах данных, используемых в ракетно-космической отрасли.

Ключевые слова: реляционная база данных, алгоритм, сложность.

ALGORITHM FOR THE ASSESSMENT OF COMPLEXITY OF THE RELATIONAL

DATABASE

L. A. Vershinnikova Scientific Supervisor - E. P. Morgunov

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: vershinnikova@yandex.ru

We considered a problem of complexity of the relational database. We analyzed the existing complexity assessment algorithm. and create a new algorithm for determination of complexity of the database. We proposed a modification of the algorithm taking into account the presence of complex links in databases used in the rocket and space area.

Keywords: relational database, algorithm, complexity.

Исследования космоса и создание ракетно-космической техники связаны с обработкой больших объёмов данных, поэтому в настоящее время большинство организаций в этой отрасли используют в своей работе базы данных (БД). Базы данных для каждого конкретного случая могут иметь разную структуру и наполнение. Возникает ряд вопросов: «Как определить степень сложности БД с точки зрения разработки или администрирования? Можно ли с помощью новой характеристики оценить трудоемкость разработки, а также стоимость выполненных работ по проектированию базы данных?» Стоит отметить, что данные вопросы очень актуальны в наше время, поскольку базы данных используются повсеместно [2].

Для решения данной проблемы предлагается создать алгоритм, который должен определять сложность реляционной базы данных на основе её метрических характеристик.

Под информативными количественными метрическими характеристиками таблицы БД понимают следующие: количество атрибутов, ключей, наличие первичного и внешних ключей и др.

Рассмотрим уже существующий алгоритм оценки сложности базы данных [1]. Опубликовал его в своей статье доцент Волжского политехнического института Рыбанов Александр Александрович. В данном алгоритме для каждой таблицы БД вычисляется вес сложности Wi по формуле:

W = д + K +1i + F■,

где Ai - количество атрибутов в i-й таблице; Ki - количество ключей в i-й таблице (учитываются первичный и альтернативные ключи); Ii - количество неуникальных индексов в i-й таблице (индексы, появившиеся в результате создания внешних ключей, при подсчете не учитываются); Fj - количество внешних ключей в i-й таблице.

Секция «Программные средства и информационные технологии»

Сложность физической схемы базы данных C вычисляется как сумма весов сложности её таблиц:

с =YFi •

Достоинства данного алгоритма: - простота вычислений; - данный алгоритм с помощью программных средств может быть использован для любой реляционной базы данных.

К недостаткам данного алгоритма следует отнести малое количество метрических характеристик, влияющих на сложность базы данных. Также у автора не учитывается степень влияния каждого параметра на полученный результат.

Сформулируем требования к разрабатываемому алгоритму. Алгоритм должен:

- использовать для оценки метрические характеристики базы данных;

- при оценке «пустой» базы данных выдавать минимальную неотрицательную оценку;

- в остальных случаях выдавать положительную оценку;

- использоваться для любой реляционной базы данных;

- при работе не требовать сложных вычислений.

Мной за основу был взят алгоритм, рассмотренный ранее. Чтобы устранить недостатки данного алгоритма, были добавлены новые метрические характеристики, такие, как количество таблиц, различных типов данных, наличие пользовательских и триггерных функций.

Формула для оценки сложности базы данных теперь выглядит следующим образом:

С = wRT + wAA + wPPK + wKFK + wII + wTDT + wFF,

где C (complexity) - сложность физической схемы базы данных; T (table) - количество таблиц в базе данных; А (attribute) - количество атрибутов; PK (primary key) - количество первичных ключей; FK (foreign key) - количество внешних ключей; I (index) - количество пользовательских индексов; DT (data type) - количество различных используемых типов данных; F (function) - количество пользовательских и триггерных функций; w' (weight) - весовой коэффициент i-го параметра (вычисляется экспериментальным путем).

Достоинства данного алгоритма:

- более полная оценка сложности базы данных, благодаря введению новых метрических параметров;

- более точная оценка сложности базы данных, благодаря введению весовых коэффициентов;

- соответствие требованиям, предъявляемым ранее.

Перспективы развития:

- определение весовых коэффициентов. Возможно они будут определяться неоднозначно и будут зависеть от внутреннего содержания базы данных;

- в алгоритм можно добавить больше метрических характеристик для более точной оценки сложности базы данных, например, количество представлений;

- в данном алгоритме не учитывается внутреннее содержание базы данных. Например, при определении сложности администрирования базы данных нужно также учитывать количество кортежей в БД.

В дальнейшем полученный результат может использоваться для прогнозирования сроков завершения разработки базы данных, для оценки её производительности и требуемых затрат.

Библиографические ссылки

1. Рыбанов А. А. Оценка сложности физической схемы реляционной базы данных [Электронный ресурс] // Современная техника и технологии. 2014. № 9. URL: http://technology. snauka.ru/2014/09/4330 (дата обращения: 02.01.2017).

2. Дейт К. Дж. Введение в системы баз данных : пер. с англ. 8-е изд. М. : Вильямс, 2005. 1328 с.: ил.

3. Селко Д. Стиль программирования Джо Селко на SQL : пер. с англ. М. : Русская редакция ; СПб. : Питер, 2006. 206 с.: ил.

© Вершинникова Л. А., 2017

i Надоели баннеры? Вы всегда можете отключить рекламу.