Решетневскуе чтения. 2017
УДК 004
ОСОБЕННОСТИ, СФЕРЫ ПРИМЕНЕНИЯ И НАПРАВЛЕНИЯ РАЗВИТИЯ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ
Д. К. Комков
Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected]
Рассмотрены особенности, сферы применения и птенциальные направления развития распределенных баз данных.
Ключевые слова: системы обработки информации, базы данных, распределенные базы данных, системы управления базами данных.
FEATURES, SPHERES OF USING AND DIRECTIONS OF DEVELOPMENT OF DISTRIBUTED DATABASES
D. K. Komkov
Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]
The article deals with the features, spheres of using and directions of development of distributed databases. Keywords: system of information processing, databases, distributed databases, information management systems.
С течением времени, количество информации, которое хранит и обрабатывает человечество, все возрастает и возрастает. Ярким примером может послужить всемирная сеть Интернет. Всего за десять лет, количество информации. Современная жизнь немыслима без эффективного управления. Важной категорией являются системы обработки информации, от которых во многом зависит эффективность работы любого предприятия или организации.
Такие системы особенно необходимы в организациях, постоянно работающих с большими объемами данных или различными типами документации.
СУБД (системы управления базами данных) (англ. Information Management System) - совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных [l].
Самым перспективным и имеющим наибольшее прикладное значение направлением развития баз данных являются распределенные системы баз данных. Распределенная база данных (DDB - distributed database) - это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети. Распределенная система управления базой данных определяется как программная система, которая позволяет управлять распределенной базой данных таким образом, чтобы ее распределенность была прозрачна для пользователей [2]. Их отличительной особенностью является распределение данных среди множества распределенных серверов, позволяя пользователю получать доступ к данным, расположенным на любом узле также, как и расположенным на своем.
Свое применение подобные базы данных находят, в первую очередь, в больших, масштабных проектах. Подобному распространению способствуют несколько основных факторов:
- надежность системы - благодаря распределению данных по многим серверам и системам дублирования данных распределенные системы позволяют обеспечивать доступ к необходимым данным практически в любой момент времени, сохраняя при этом оптимальную скорость отклика;
- скорость - использование множества серверов также позволяет оперировать значительно большими объемами данных, чем позволяют обычные системы, не теряя при этом скорости.
Благодаря таким особенностям, распределенные системы баз данных находят применение во многих областях, включая
На данный момент, наиболее распространена следующая классификация распределенных систем баз данных:
1) распределённые базы данных;
2) мультибазы данных с глобальной схемой. Система мультибаз данных - это распределённая система, которая служит внешним интерфейсом для доступа ко множеству локальных СУБД или структурируется, как глобальный уровень над локальными СУБД;
3) федеративные базы данных. В отличие от мультибаз не располагают глобальной схемой, к которой обращаются все приложения. Вместо этого поддерживается локальная схема импорта-экспорта данных. На каждом узле поддерживается частичная глобальная схема, описывающая информацию тех удалённых
Программные средства и информационные технологии
источников, данные с которых необходимы для функционирования.
4) мультибазы с общим языком доступа - распределённые среды управления с технологией «клиент-сервер»;
5) интероперабельные системы - это системы, в которых сами приложения, выполняемые в среде той или иной СУБД, ответственны за интерфейсы между различными средами приложения, независимо от того, являются они однородными или неоднородными. Системы ориентированы главным образом на обмен данными. Дальнейшее развитие этих систем является объектно-ориентированные БД. Основной причиной применения систем баз данных, является стремление собрать все обрабатываемые данные в единое целое и обеспечить к ним контролируемый доступ [3].
По своему принципу работу, большинство РБД созданы на основе реляционных баз данных, это способствует их широкому распространению в официальных структурах, таких как банки, большие предприятия, имеющие собственные склады и производства и прочие, имеющие четкую систему взаимодействий, образования.
Этим объясняется их отсутствие в управлении большим количеством неструктированных объемов данных. В таких сферах наибольшее распространение получили так называемые NoSQL системы. NoSQL системы - термин, обозначающий ряд подходов, направленных на реализацию хранилищ баз данных, имеющих существенные отличия от моделей, используемых в традиционных реляционных СУБД с доступом к данным средствами языка SQL [4].
Для того, чтобы понять, в чем же главные отличия распределенных баз данных и NoSQL систем, сравним их по нескольким основным признакам:
- структура и тип хранящихся данных: SQL/реля-ционные базы данных требуют наличия однозначно определённой структуры хранения данных, а NoSQL базы данных таких ограничений не ставят;
- запросы: вне зависимости от лицензии, РСУБД реализуют SQL-стандарты, поэтому из них можно получать данные при помощи языка SQL. Каждая NoSQL база данных реализует свой способ работы с данными;
- масштабируемость: оба решения легко растягиваются вертикально (например, путём увеличения системных ресурсов). Тем не менее, из-за своей современности, решения NoSQL обычно предоставляют более простые способы горизонтального масштабирования (например, создания кластера из нескольких машин);
- надёжность: когда речь заходит о надёжности, SQL базы данных однозначно впереди;
- поддержка: РСУБД имеют очень долгую историю. Они очень популярны, и поэтому получить поддержку, платную или нет, очень легко. Поэтому, при
необходимости, решить проблемы с ними гораздо проще, чем с NoSQL, особенно если проблема сложна по своей природе (например, при работе с MongoDB);
- хранение и доступ к сложным структурам данных: по своей природе реляционные базы данных предполагают работу с сложными ситуациями, поэтому и здесь они превосходят NoSQL-решения [5].
Проанализировав всю имеющуюся информацию, был сделан вывод относительно возможностей развития РБД. Подобные системы ограничены, в первую очередь жесткими требованиями к структуре, что в значительной мере ограничивает их распространение. С другой стороны, сама идея изменения требований к структуре противоречит основополагающим принципам РБД. Таким образом, следует рассматривать РБД как достигшую значительных успехов в развитии систему, но проводить исследования уже в других направлениях, в том числе и в направлении интеграции существующих систем управления данными.
Библиографические ссылки
1. Системы управления базами данных [Электронный ресурс]. URL: http://dic.academic.ru/dic.nsf/ ruwiki/8509 (дата обращения: 01.09.2017).
2. Распределенные и параллельные системы баз данных [Электронный ресурс]. URL: http://citforum.ru/ database/classics/distr_and_paral_sdb/ (дата обращения: 01.09.2017).
3. Распределенные базы данных [Электронный ресурс]. URL: http://dic.academic.ru/dic.nsf/ruwiki/596785 (дата обращения: 01.09.2017).
4. Базы данных SQL, NoSQL и различия в моделях баз данных [Электронный ресурс]. URL: http:// devacademy.ru/posts/sql-nosql/ (дата обращения: 01.09.2017).
5. SQL и NoSQL [Электронный ресурс]. URL: https://tproger.ru/translations/sql-nosql-database-models/ (дата обращения 01.09.2017).
References
1. Information Management Systems. Available at: http:// dic.academic.ru/dic.nsf/ruwiki/8509 (accessed: 01.09.2017).
2. Distributed and paralled databases. Available at: http://citforum.ru/database/classics/distr_and_paral_sdb/ (accessed: 01.09.2017).
3. Distributed databases. Available at: http://dic. aca-demic.ru/dic.nsf/ruwiki/ (accessed: 01.09.2017).
4. SQL Databases, NoSQL and differences in databases models. Available at: http://devacademy.ru/posts/ sql-nosql/ (accessed: 01.09.2017).
5. SQL и NoSQL. Available at: https://tproger.ru/ translations/sql-nosql-database-models/ (accessed: 01.09.2017).
© Комков Д. К., 2017