Научная статья на тему 'Подходы к хранению данных в «Облаке»'

Подходы к хранению данных в «Облаке» Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
125
20
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Соболь А.С.

«Облачные» вычисления технология распределенной обработки данных, в которой компьютерные ресурсы и мощности предоставляются пользователю как интернет-сервис. рассмотрены различные подходы хранения данных внутри «облака» на примере PaaS (Platform as a service) модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPROACHES OF DATA STORAGE IN THE «CLOUD»

«Cloud» computing the technology of distributed data processing, in which computing resources and facilities are available to a user as an online service. The different approaches of data storage in the "cloud" on the example of PaaS (Platform as a service) model are highlighted.

Текст научной работы на тему «Подходы к хранению данных в «Облаке»»

Информационные системы и технологии

Библиографические ссылки

1. Савицкий, Р. С. Программная реализация метода статистических испытаний // Актуальные проблемы авиации и космонавтики : материалы VIII Всерос.

науч.-практич. конф. творческой молодежи / Сиб. гос. аэрокосмич. ун-т. Красноярск, 2012.

2. Гуров С. В., Половко А. М. Основы теории надежности : учеб. пособие. 2-е изд., перераб. и доп. СПб. : БХВ-Петербург, 2006. 704 с.

Главное окно программы Calculation of reliability R. S. Savitskiy

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

AUTOMATED CALCULATION OF A STRUCTURAL REDUNDANCY SCHEME

It is necessary to calculate parameters of reliability. The information about software, which increases reliability of system increasing reliability weak elements, is presented. Reliability of weak elements is increased due to using structural redundancy schemes.

© Савицкий Р. С., 2012

УДК 004.652

А. С. Соболь

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

ПОДХОДЫ К ХРАНЕНИЮ ДАННЫХ В «ОБЛАКЕ»

«Облачные» вычисления - технология распределенной обработки данных, в которой компьютерные ресурсы и мощности предоставляются пользователю как интернет-сервис. рассмотрены различные подходы хранения данных внутри «облака» на примере PaaS (Platform as a service) модели.

Облачные вычисления - современная «золотая использование «облачных» вычислений в рамках ре-жила» ИТ-индустрии, и при этом - целая революция в шения конкретных задач. В одном из «облачных» ведении бизнеса. Однако атмосфера всеобщего воз- подходов, а именно PaaS-системах, внимание разра-

буждения мешает разобраться, насколько действенно ботчиков сосредоточено на серверах приложений,

Решетневскце чтения

веб-серверах и технологиях разработки веб-приложений. При этом недостаточно внимания уделяется проблеме масштабирования баз данных в «облаке», хотя едва ли это означает, что данная проблема вообще не имеет значения.

Как уже было сказано, проблема масштабирования баз данных в «облаке» имеет место быть. Так, Майкл Стоунбрейкер, признанный эксперт в области баз данных и создатель нескольких известных СУБД, включая PostgreSQL и Ingres, считает, что громоздкая система хранения данных на базе MySQL в основе популярного сервиса Facebook - это «участь, которая хуже, чем сама смерть». По сведениям Стоунбрейке-ра, для поддержания работоспособности Facebook в настоящее время используется 4 000 сегментов MySQL и 9 000 экземпляров кэширующего сервера memcached. По мнению эксперта, единственный выход из сложившейся ситуации - переписать систему хранения данных с нуля, используя при этом более подходящие инструменты. «Старая модель SQL ни на что не годится; ее нужно отправить в дом престарелых программных продуктов», - считает эксперт [1].

При этом, говоря о high-load проектах в «облаке», основными недостатками традиционного SQL подхода, являются:

- плохое горизонтальное масштабирование при больших объемах данных;

- не гибкий дизайн логической структуры;

- повышенное внимание к производительности каждого отдельного сервера.

Для хранения данных в «облаке», также существует подход No SQL, существенно отличающийся от SQL. В качестве одного из методологических обоснований подхода NoSQL используется эвристический принцип, известный как теорема CAP, утверждающая, что в распределенной системе невозможно одновременно обеспечить согласованность данных, доступность и устойчивость к расщеплению распределенной системы на изолированные части. Таким образом, при необходимости достижения высокой доступности и устойчивости к разделению предполагается не фокусироваться на средствах обеспечения согласованности данных, обеспечиваемых традиционными SQL-ориентированными СУБД с транзакционными механизмами на принципах ACID (модели, по которой определяют качество транзакционных систем хранения данных).

Несмотря на то, что большинство PaaS-поставщиков предлагают NoSQL-системы, большая

часть этих систем хоть и избавилась от ряда «проблем» SQL-систем, но при этом до сих пор так и не позволяет осуществлять достаточного масштабирова -ния по мере роста объема данных в «облаке», а также негативно влияет на атомарность и согласованность системы. Среди исключений можно назвать лишь такие сервисы, как Google App Engine и Amazon Simple DB, но при этом разработчики принесли реляцион-ность в жертву масштабируемости.

Проблему хранения данных в «облаке» можно решить, используя лишь качественно новый подход. Следуя идентификации Стоунбрейкера об основном недостатке SQL-систем, говорящем о том, что «процессоры быстрее уже не станут, но число ядер продолжит расти. Поэтому проблему горизонтального масштабирования СУБД между множеством процессоров необходимо решать», можно выделить разрабатываемый подход NewSQL. Данные системы изначально обладают свойством масштабируемости, что критически важно как в high-load проектах, так и в «облаке». Особенность NewSQL-систем в том, что обеспечивая выполнение требований ACID, они игнорируют большинство других функций, негативно влияющих на производительность, обладают рядом инновационных архитектурных решений:

- не используется ресурсоемкий буферный пул, поскольку база данных целиком находится в основной памяти;

- устраняется потребность в краткосрочных блокировках данных, поскольку система исполняется на сервере строго - в виде одиночного потока;

- «дорогостоящие» операции восстановления исключаются за счет применения дополнительных серверов для тиражирования и переключения нагрузки при отказе.

Подводя итог, можно отметить, что NewSQL-система обеспечивает гарантии качества выполнения транзакций, свойственные SQL-системам, и при этом обладает масштабируемостью на уровне No SQL-систем. К числу NewSQL-систем относятся Xeround, Clustrix, NimbusDB, GenieDB, VoltDB. Данные СУБД в наилучшей степени удовлетворяют требованиям хранения данных в «облаке», а также позволяют максимально раскрыть потенциал современных центров обработки данных.

Библиографическая ссылка

1. Облачные сервисы. Взгляд из России / под ред. Е. Гребнева. M. : CNews, 2011. 55 c.

A. S. Sobol

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

APPROACHES OF DATA STORAGE IN THE «CLOUD»

«Cloud» computing - the technology of distributed data processing, in which computing resources and facilities are available to a user as an online service. The different approaches of data storage in the "cloud" on the example of PaaS (Platform as a service) model are highlighted.

© Соболь А. С., 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.