Обзор RAID
RAID — это технология, используемая для повышения производительности и надёжности систем хранения данных. Система RAID состоит из двух или более дисков, работающих параллельно; это могут быть как жёсткие диски, так и SSD (твердотельные накопители). Системы RAID можно разделить на SoftRAID и HardRAID. В SoftRAID управление архитектурой памяти осуществляется операционной системой. В HardRAID для управления памятью в диске имеется специальный контроллер и процессор.
Уровни RAID
Уровни RAID включают базовые уровни RAID (0, 1, 5 и 6) и уровни RAID с чередованием (10, 50 и 60).Чередующиеся массивы RAID объединяют два или более базовых массива RAID для обеспечения более высокой производительности, емкости и доступности за счет преодоления ограничения на максимальное количество дисков, поддерживаемых каждым массивом на конкретном RAID-контроллере.
RAID 0
RAID 0 основан на чередовании данных, при котором поток данных разбивается на несколько сегментов или блоков, каждый из которых хранится на отдельном диске. Таким образом, когда системе требуется прочитать данные, она может одновременно считывать данные со всех дисков и объединять их для воссоздания полного потока данных. Преимущество этого подхода заключается в том, что операции чтения/записи выполняются значительно быстрее, что делает его идеальным для сценариев, в которых производительность имеет приоритет над другими соображениями. Кроме того, общая емкость всего тома равна сумме емкостей всех отдельных дисков.

Что такое чередование? Данные разбиваются на несколько дисков и равномерно распределяются по всем дискам, что исключает перегрузку какого-либо одного диска. Данные могут извлекаться одновременно с нескольких дисков, что повышает скорость и производительность.
Преимущества
• Данные распределены по нескольким дискам
• Дисковое пространство полностью заполнено
• Требуется как минимум 2 диска
• Высокая производительность
Недостатки
• Не поддерживает избыточность данных
• Не поддерживает отказоустойчивость
• Отсутствие механизма обнаружения ошибок
• Выход из строя любого отдельного диска приводит к полной потере данных в соответствующем массиве
RAID 1
В массиве RAID 1 используется принцип зеркалирования данных, при котором данные дублируются или клонируются на набор одинаковых дисков, так что в случае выхода одного диска из строя можно использовать другой. Это также повышает производительность чтения, поскольку одновременный доступ к разным блокам данных возможен со всех дисков.
Однако, в отличие от RAID 0, производительность записи снижается, поскольку при записи новых данных необходимо обновлять все диски. Еще одним недостатком является то, что при дублировании данных происходит растрата места, что приводит к увеличению затрат на хранение данных.

Что такое зеркалирование данных? Зеркалирование данных на нескольких дисках означает, что копии данных хранятся на разных устройствах хранения, что также повышает избыточность и производительность.
RAID 1 — наиболее распространённый тип массива RAID, предназначенный для повышения безопасности хранимых данных. Например, если файл записывается и сохраняется на одном жестком диске, он автоматически сохраняется на жестких дисках 2, 3 или других дисках. Это означает, что система обеспечивает полную избыточность, то есть в случае выхода из строя одного диска второй диск готов взять на себя его функции.
Преимущества
·Осуществляет зеркалирование данных, при котором одинаковые данные с одного диска записываются на другой диск для обеспечения избыточности.
• Высокая скорость чтения, так как при занятости одного диска можно использовать любой другой
• Массив продолжает работать в обычном режиме даже в случае выхода из строя любого диска
• Требуется как минимум 2 диска
Недостатки
• Более высокая стоимость (для каждого диска требуется дополнительный диск для зеркалирования)
• Снижение скорости записи из-за необходимости обновления всех дисков
RAID 5
Для массива RAID 5 требуется как минимум три диска; как и в случае с RAID 0, данные распределяются по нескольким дискам, но при этом по дискам также распределяется «паритет». В случае выхода из строя одного диска для восстановления данных используется информация о паритете, хранящаяся на остальных дисках. Время простоя составляет ноль. Скорость чтения очень высокая, но скорость записи немного ниже из-за необходимости вычисления контрольной суммы. Это идеальное решение для файловых и прикладных серверов с ограниченным количеством дисков для хранения данных.

В массиве RAID 5 из-за использования контрольных сумм теряется 33 % объёма хранилища (при использовании трёх дисков), но такая конфигурация по-прежнему является более экономичной, чем RAID 1. В наиболее распространённой конфигурации RAID 5 используется четыре диска, что позволяет сократить потерю объёма хранилища до 25 %. Такая система может работать с количеством дисков до 16.
RAID 5 также известен как чередование с распределённой контрольной суммой:

Преимущества
·Распределение данных по блокам с распределённой контрольной суммой
·Распределение паритета по дискам массива
·Высокая производительность
·Экономически выгодное
·Требуется не менее 3 дисков
Недостатки
• В случае сбоя диска восстановление может занять больше времени, так как необходимо вычислить контрольную сумму по данным со всех доступных дисков
• Не допускает одновременного выхода из строя дисков
RAID 6
RAID 6 использует двойные блоки четности, что обеспечивает более высокую степень избыточности данных по сравнению с RAID 5 и позволяет выдерживать отказ до двух дисков в массиве. На каждом диске имеется по два блока четности, которые хранятся на разных дисках массива. RAID 6 — это чрезвычайно эффективная инфраструктура для обеспечения высокой доступности систем.

RAID 6 — хороший выбор для стандартных веб-серверов, где большинство операций связано с чтением, однако его не рекомендуется использовать в средах с интенсивной записью, таких как серверы баз данных.
RAID 6 также известен как чередование с двойной распределенной контрольной суммой:

Преимущества
·Снятие блоков с распределённой четностью DUAL
·Создает 2 блока с контрольной суммой
·Способен выдержать одновременный отказ двух дисков в массиве
·Дополнительная отказоустойчивость и резервирование
·Требуется не менее 4 дисков
Недостатки
• Стоимость может сыграть свою роль
• Запись данных занимает больше времени из-за двойного контрольного суммы
RAID 10 (RAID 1+0)
RAID 10 сочетает в себе RAID 1 и RAID 0 в обратном порядке. Иногда его называют «вложенным» или «гибридным» RAID, поскольку он сочетает в себе лучшие качества обеих технологий: высокую производительность RAID 0 и избыточность RAID 1. В этой конфигурации несколько массивов RAID 1 соединяются между собой, чтобы работать как RAID 0. Она используется, когда требуются как высокая производительность дисков (выше, чем у RAID 5 или 6), так и избыточность.

Преимущества
·Без четности
·Обеспечивает чередование данных в массивах RAID 0 и зеркалирование в массивах RAID 1
·Нанесение полос выполняется до зеркального отображения
·Доступный объем равен n/2 * размер диска (n = количество дисков)
·Количество необходимых дисков должно быть кратно 2
·Высокая производительность при разбиении данных на полосы
Недостатки
• Высокая стоимость, так как для каждого диска требуется дополнительный накопитель
• Объём диска используется не полностью, так как половина занимает зеркальное копирование
• Очень ограниченная масштабируемость
RAID 50
RAID 50 состоит из двух или более массивов RAID 5, образующих чередующийся массив, аналогичный RAID 0. По сравнению с конфигурацией из того же количества массивов RAID 5 он обеспечивает более высокую производительность доступа и более надежную защиту данных. Один массив, эквивалентный RAID 5, называется «подмножеством» или «подмассивом», и можно настроить три или более подмножеств.

RAID 50 можно использовать на серверах и массивах для работы различных приложений, таких как файловые серверы, серверы баз данных, хранение данных и резервное копирование виртуальных машин, монтаж видео, рендеринг 3D-анимации и т. д.
RAID 50 также известен как массив с чередованием блоков и распределенной контрольной суммой:

Преимущества
·Сокращает время восстановления
·Повышает эффективность системы резервирования
·Повышает производительность доступа
Недостатки
·Требуется более 6 дисков
·Снижает эффективность установки
·Ограниченная избыточность
RAID 60
RAID 60 (иногда называемый RAID 6+0) объединяет несколько массивов RAID 6 (чередование с двойной контрольной суммой) с массивом RAID 0 (чередование). Двойная четность позволяет выходу из строя двух дисков в каждом массиве RAID 6, а чередование блоков увеличивает емкость и производительность без добавления дисков в каждый массив RAID 6.
Как и RAID 50, конфигурации RAID 60 могут включать 8 и более дисков, однако они подходят только для систем, состоящих из 16 и более дисков. Используемая емкость массива RAID 60 составляет от 50% до 88% в зависимости от количества дисков с данными в массиве.
Обратите внимание, что все перечисленные выше многоветвистые конфигурации, доступные для RAID 10 и RAID 50, также доступны для RAID 60. Например, для 36 дисков можно создать массив RAID 60, в котором каждая ветвь будет содержать 18 дисков, или массив RAID 60 с тремя ветвями, каждая из которых будет содержать 12 дисков.
RAID 60 похож на RAID 50, но обеспечивает более высокую степень избыточности, благодаря чему он подходит для серверов с чрезвычайно большим объемом хранения, особенно для тех, на которых не создаются резервные копии данных (например, серверов видеонаблюдения, обрабатывающих данные с большого количества камер).
RAID 60 также известен как массив с чередованием блоков по зонам и двойной распределенной контрольной суммой:

Преимущества
·Каждый массив RAID 6 в группе способен выдержать отказ двух дисков, что обеспечивает высокую степень надежности.
·Очень большой и экономичный, учитывая, что этот уровень RAID не используется, если не задействовано большое количество дисков.
Недостатки
• Требуется большое количество дисков
• Немного дороже, чем RAID 50, из-за необходимости использования большего количества дисков для вычисления контрольной суммы
Сравнение уровней RAID
Выбор уровней RAID зависит от следующих факторов:
• Производительность чтения
• Производительность записи
• Отказоустойчивость
• Снижение производительности массива (для отказоустойчивых уровней RAID)
• Фактическая емкость