Научная статья на тему 'АНАЛИЗ СОВРЕМЕННЫХ ТЕНДЕНЦИЙ ПОВЫШЕНИЯ НАДЁЖНОСТИ И ПРОИЗВОДИТЕЛЬНОСТИ СИСТЕМ ХРАНЕНИЯ ДАННЫХ'

АНАЛИЗ СОВРЕМЕННЫХ ТЕНДЕНЦИЙ ПОВЫШЕНИЯ НАДЁЖНОСТИ И ПРОИЗВОДИТЕЛЬНОСТИ СИСТЕМ ХРАНЕНИЯ ДАННЫХ Текст научной статьи по специальности «Медицинские технологии»

CC BY
13
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
хранение данных / производительность / дисковый массив / data storage / performance / disk array

Аннотация научной статьи по медицинским технологиям, автор научной работы — Гладков М. В.

В работе произведен анализ современных тенденций развития информационных технологий в части построения отказоустойчивых систем хранения и обработки данных. Проанализированы преимущества и недостатки различных RAID массивов. Представлен сравнительный анализ наиболее используемых уровней RAID.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF CURRENT TRENDS IN IMPROVING RELIABILITY AND PERFORMANCE OF DATA STORAGE SYSTEMS

Paper analyzes current trends in the development of information technologies in terms of building fault-tolerant data storage and processing systems. The advantages and disadvantages of various RAID arrays are analyzed. A comparative analysis of the most used RAID levels is presented.

Текст научной работы на тему «АНАЛИЗ СОВРЕМЕННЫХ ТЕНДЕНЦИЙ ПОВЫШЕНИЯ НАДЁЖНОСТИ И ПРОИЗВОДИТЕЛЬНОСТИ СИСТЕМ ХРАНЕНИЯ ДАННЫХ»

УДК 004.3

Гладков М.В.

студент 2 курса магистратуры по направлению «Управление корпоративными информационными процессами» Тольяттинский государственный университет (г. Тольятти, Россия)

АНАЛИЗ СОВРЕМЕННЫХ ТЕНДЕНЦИЙ ПОВЫШЕНИЯ НАДЁЖНОСТИ И ПРОИЗВОДИТЕЛЬНОСТИ СИСТЕМ ХРАНЕНИЯ ДАННЫХ

Аннотация: в работе произведен анализ современных тенденций развития информационных технологий в части построения отказоустойчивых систем хранения и обработки данных. Проанализированы преимущества и недостатки различных RAID массивов. Представлен сравнительный анализ наиболее используемых уровней RAID.

Ключевые слова: хранение данных, производительность, дисковый массив.

В настоящее время постоянно возрастают объемы хранимых и обрабатываемых данных в организациях различных масштабов. Прогрессируют технологии хранения. На смену привычным Н(жесткий диск) пришли SSD (твердотельный накопитель) накопители различных формфакторов.

Внедрение новых технологических решений позволило значительно повысить скорости чтения и записи данных. Вместе с тем возросли требования информационных систем к надежности и производительности систем хранения данных (СХД). С целью обеспечения надежности данных и повышения производительности СХД используется технология RAID.

Аббревиатура RAID расшифровывается как «Redundant Array of Independent Disks», т. е. «избыточный массив независимых дисков». Впервые RAID был представлен миру в далеком 1987 году, когда на свет вышла статья,

описывающая технологию объединения нескольких обычных дисков в массив для получения более быстрого и надежного накопителя [2].

Наиболее распространенные уровни RAID:

RAID 0 (striping — «чередование») — дисковый массив из двух или более жёстких дисков без резервирования. Информация разбивается на блоки данных фиксированной длины и записывается на оба/несколько дисков поочередно, то есть один блок на первый диск, а второй блок на второй диск соответственно^]. Данная реализация дискового массива является наиболее производительной в плане скорости чтения/записи, при этом наиболее уязвимой с точки зрения рисков потери данных. В СХД данный уровень применяется крайне редко из-за рисков потери всех данных при выходе из строя любого из дисков массива. При использовании данного массива отсутствуют потери дискового пространства на обеспечение резервирования данных.

RAID 1 (mirroring — «зеркалирование») — массив из двух или более дисков, являющихся полными копиями друг друга[1]. Дисковый массив имеет высокую скорость чтения и скорость записи, равную скорости записи на диск без использования массива. Зачастую применяется для обеспечения полного резервирования критичных данных в серверах. В СХД применяется редко из-за высоких затрат на реализацию. Массив обеспечивает высокую защиту данных от потерь, однако при его использовании потери дискового пространства составляют половину от общего объема.

RAID 2 - массив, основанный на использовании кода Хэмминга. Дисковый массив обеспечивает производительность выше, чем использование одного диска. Данный массив обеспечивает высокую защиту от потери данных. Его организация является целесообразной при использовании 7 и более дисков. Немногие СХД поддерживают реализацию RAID 2.

RAID 3 - массив, в котором один диск используется для контроля четности, остальные диски используются для хранения мелких блоков данных. Обеспечивает высокую скорость работы с большими файлами. Минимальное количество дисков, необходимых для организации массива, равно 3. Ввиду

необходимости хранения разрозненной информации, массив данного типа редко используется в СХД.

RAID 4 - массив похож на RAID 3, но данные разбиваются на блоки большего объема, ввиду чего увеличилась скорость работы с маленькими файлами. В системах СХД встречается редко. Наиболее известная реализация в устройствах производителя NetAPP, где массив используется совместно с внутренней файловой системой WAFL[1].

RAID 5 — массив с чередованием блоков данных и контролем чётности [1]. Массив обеспечивает высокую производительность операций чтения, при этом снижена производительность на операциях «random write». Массив достаточно экономичен в плане потери дискового пространства на обеспечение резервирования данных, однако требует пристального внимания за состоянием дисков, т.к. потеря одного диска с последующей заменой приводит к длительному восстановлению работы массива. Данный тип дискового массива получил широкое распространение в СХД и используется в системах с синхронизацией данных между несколькими СХД.

RAID 6 — массив из четырёх или более дисков с проверкой чётности, разработанный для защиты от потери данных при выходе из строя сразу двух жёстких дисков в массиве. Надежность достигается за счет снижения производительности и уменьшения емкости[1]. Реализован в большинстве СХД, применяется в системах с высокими требованиями к сохранности данных и низкими требованиями к производительности.

Для устранения недостатков производительности и сохранности данных получили распространение RAID массивы смешанного типа, которые строятся путем объединения массивов разных типов. Так популярностью пользуются RAID 10 (RAID 0 с сегментами массивов RAID 1[3]), RAID 50 (Массив RAID 0 из массивов RAID 5), RAID 60 (Массив RAID 0 из массивов RAID [3]) и др.

Сравнение основных характеристик наиболее используемых RAID массивов приведено в таблице 1 [3]

Таблица 1. Сравнение уровней RAID.

Уровень Количество дисков Эффективная емкость Допустимое количество вышедших из строя дисков Надежность Скорость чтения Скорость записи

RAID 0 от 2 S * N 0 очень низкая высокая высокая

RAID 1 от 2 S N-1 очень высокая средняя средняя

RAID 10 от 4, чётное SxN/2 от 1 до N/2 Высокая высокая высокая

RAID 5 от 3 Sx(N-1) 1 средняя высокая средняя

RAID 50 от 6, чётное Sx(N-2) от 1 до 2 средняя высокая высокая

RAID 6 от 4 Sx(N-2) 2 высокая высокая низкая или средняя

RAID 60 от 8, чётное Sx(N-4) от 2 до 4 средняя высокая средняя

N - количество дисков в массиве, S - объём наименьшего диска.

Использование RAID массивов позволяет повысить надежность хранения данных, скорость чтения/записи с минимизацией использования дополнительных дисков в массиве. При выборе типа массива следует учитывать тип хранимых данных, требования к производительности и надежности хранения.

СПИСОК ЛИТЕРАТУРЫ:

1. RAID [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/RAID;

2. Надежность превыше всего. Использование RAID-массивов [Электронный ресурс]. URL: http://lki.ru/text.php?id=4784;

3. Чеботарев В.А. СРАВНЕНИЕ УРОВНЕЙ RAID//Материалы XIII Международной студенческой научной конференции «Студенческий научный форум» URL: https://scienceforum.ru/2021/article/2018025366

Gladkov M.V.

Tolyatti State University (Tolyatti, Russia)

ANALYSIS OF CURRENT TRENDS IN IMPROVING RELIABILITY AND PERFORMANCE OF DATA STORAGE SYSTEMS

Abstract: paper analyzes current trends in the development of information technologies in terms of building fault-tolerant data storage and processing systems. The advantages and disadvantages of various RAID arrays are analyzed. A comparative analysis of the most used RAID levels is presented.

Keywords: data storage, performance, disk array.

i Надоели баннеры? Вы всегда можете отключить рекламу.