Научная статья на тему 'ОСНОВЫ NOSQL'

ОСНОВЫ NOSQL Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
12
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
база данных / хранилище / модель данных / тип хранилища / масштабируемость / database / storage / data model / storage type / scalability

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Я.Д. Димитрова, Е.В. Филюшина

В статье рассматривается база данных NoSQL и ее плюсы и минусы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NOSQL BASICS

The article discusses the NoSQL database and its pros and cons.

Текст научной работы на тему «ОСНОВЫ NOSQL»

Актуальные проблемы авиации и космонавтики - 2021. Том 2

УДК 004.652

ОСНОВЫ NOSQL

Я. Д. Димитрова, Е. В. Филюшина

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: dimitrovayan@mail.ru

В статье рассматривается база данных NoSQL и ее плюсы и минусы.

Ключевые слова: база данных, хранилище, модель данных, тип хранилища, масштабируемость.

NOSQL BASICS

Y. D. Dimitrova, E. V. Filyushina

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation Е-mail: dimitrovayan@mail.ru

The article discusses the NoSQL database and its pros and cons.

Keywords: database, storage, data model, storage type, scalability.

В 1988 году Карло Строцци представляет NoSQL, тогда эта была реляционная база данных, которая, использовала шелловские скрипты вместо SQL для доступа к данным, то есть база была с открытым исходным кодом. Позже, в 2009 году, этот термин был снова введен и он обозначал подход к реализации масштабируемой базы информации с гибкой моделью. Но сейчас NoSQL является нереляционной СУБД, которая легко масштабируется и не требует фиксированной схемы. Для чего же используют такие базы данных? Для распределенных хранилищ данных с большими потребностями хранения информации. В наше время, NoSQL используется для огромных данных и веб-приложений в реальном времени, чтобы собирать данные пользователей каждый день. [1]

База данных NoSQL включает в себе большой спектр технологий, что позволяет хранить структурированные и неструктурированные, полуструктурированные и полиморфные данные. А также особенностью является то, что каждое решение в такой базе данных использует собственную модель. В зависимости от этих модели данных, можно выделить несколько типов хранилищ.

Первым простым хранилищем будет хранилище на основе пар «ключ-значение». Это тип базы, где данные хранятся как совокупность пар «ключ-значение». Ключ играет роль уникального идентификатора. Ключи и значения могут представлять собой любую простую или сложную, составную или байтовую информацию. Такой тип хранилища имеет возможности для горизонтального масштабирования. И такие СУБД применяются для хранения изображений, для создания специализированных файлов систем, в качестве кэшей для объектов, в Big Data системах, включая рекламные и игровые приложения, в проектах интернета вещей. [2]

Следующим будет документо-ориентированное хранилище, где данные представлены парами «ключ-значение», и они сжимаются в виде полуструктурированного документа из тегированных элементов, аналогично XML, BSON и другим схожим форматам. База данных

Секция «Информационно-экономические системы»

с таким хранилищем хорошо подходит для каталогов, для профилей пользователей и систем управления контентом, в котором каждый документ является уникальным и изменяется с течением времени. Примерами таких баз данных могут быть CMS-система, издательское дело или документальный поиск.

Третьим типом будет колоночное хранилище, хранящиеся информацию в виде разреженной матрицы, в которой строки и столбцы используются как ключи, что позволяет обеспечить высокую производительность записи информации. Также эти хранилища называют «семейством столбцов» в мире больших данных. Значения в таких системах хранятся в столбцах, по-другому в колонках, которые представлены в отдельных файлах. Такое хранилище позволяет хранить большое количество атрибутов в сжатом виде, что ускоряет выполнение запросов к базе, в особенности операции поиска и агрегации данных. Колоночная база данных имеет применение в организации счетчиков, регистрации и обработки событий в таких системах, как системы биржевой аналитики, системы управления содержимым и так далее.

И последним является графовое хранилище. Оно представляет собой сетевую базу, использующую узлы и ребра для отображения и хранения данных. Так как узлы графа используются для хранения сущностей и его ребра хранят в себе данные о взаимосвязях между сущностями, то его обход не требует дополнительных действий, допустим, как соединение в SQL. Такие хранилища используют в задачах, которые ориентированы на связи. Например, социальные сети и выявление мошенничества, маршруты общественного транспорта и дорожные карты, семантические паутины и так далее. [3]

Так чем хороши или плохи нереляционные базы данных? Выделим главные преимущества и недостатки NoSQL.

Главными преимуществами являются линейная масштабируемость, гибкость, что позволяет с легкостью изменить схему без простоя и нарушения работы, простая репликация, возможность работы с большими данными, нет единой точки отказа, высокая производительность, возможность обработки разных данных с одним и тем же эффектом и другие.

Недостатками являются отсутствие правил стандартизации, ограничены возможности запросов, если объем данных увеличивается, то становится трудно поддерживать уникальные значения из-за того, что ключи станут сложными. Также нет возможности работать с реляционными базами данных, и для предприятий NoSQL не популярна, так как есть варианты с открытым исходным кодом. [4]

В заключение, можно сказать, что база данных NoSQL удобна только для работы определенной аудиторий, и в основном для социальных сетей и веб-приложений, но не для ведения бизнеса и анализа данных. Однако при обработке больших данных есть возможность выбрать решение, исходя из специфики самой задачи. Но минусы она имеет весомые, ведь, допустим, выявлять с 100% точностью мошенников в сети не получиться, так как будет поступать большой объем данных и ключ станет сложным, тем самым система просто не заметит нарушителей.

Библиографические ссылки

1. NoSQL понимаем суть [Электронный ресурс]. URL: https://habr.com/ru/post/152477/ (дата обращения: 26.01.2021).

2. NoSQL подход в хранении данных [Электронный ресурс]. URL: https://jazzteam.org/ru/technical-articles/nosql-storage-approach/ (дата обращения: 26.01.2021).

3. NoSQL [Электронный ресурс]. URL: https://www.bigdataschool.ru/wiki/nosql (дата обращения 26.01.2021).

4. Учебник по NoSQL [Электронный ресурс]. URL: https://coderlessons.com/tutorials/bazy-dannykh/uchebnik-mongodb/2-uchebnik-po-nosql#9 (дата обращения 26.01.2021).

© Димитрова Я. Д., Филюшина Е. В. 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.