Самостоятельная настройка RAID
Сегодня мы покажем процесс создания массива с уровнем RAID 5. В качестве тестового устройства возьмем пятидисковое хранилище — Thecus N5550.
В первую очередь необходимо установить HDD. Как мы уже говорили в выпуске ЭО №3/2015, выбирать необходимо только «правильные» HDD, то есть из списка совместимых. Затем в адресной строке браузера набираем IP-адрес хранилища, для входа в Web-интерфейс (обнаружить устройство в сети можно с помощью специальной утилиты в комплекте, более подробно описано в руководстве пользователя).
После чего переходим в раздел «Управление RAID» и нажимаем клавишу «Создать».
Далее нам надо будет отметить доступные жесткие диски. Как мы уже знаем, для RAID5 уровня необходимо минимум 3 диска.
В следующем диалоговом окне выбираем уровень RAID и нажимаем «Далее».
Теперь нам нужно будет назвать наш массив в поле RAID ID (например, Office).
В этом же диалоговом окне мы можем зашифровать наш RAID, отметив соответствующий пункт меню. К слову сказать, шифрование идет с ключом AES 256, поэтому советуем быть очень аккуратными с паролем и хранением ключа, так как в случае его утери восстановить массив будет невозможно!
На следующем этапе нам предстоит выбрать тип файловой системы. Всего доступно 4 варианта: EXT3, EXT4, XFS и BTRFS. Поддержка последней была добавлена относительно недавно, что не может не радовать, так как одной из возможностей этот файловой системы, является создание моментальных снимков (snapshoot), а эта функция бывает часто востребована там, где необходимо следить за любыми изменениями на дисках и всегда иметь возможность откатиться обратно.
В нашем примере мы выберем файловую систему по умолчанию EXT4, как наиболее распространенный вариант.
Затем необходимо подтвердить процесс создания массива, нажав клавишу «Отправить».
После чего будет запущен процесс создания, по завершению которого мы получим наш массив с уровнем RAID 5, о чем будет говорить статус «Исправен» в разделе «Управление RAID».
И далее можно будет уже переходить непосредственно к процессу создания папок и переносу информации на NAS.
Какие сложности могут возникнуть в процессе работы RAID массива и что в этом случае делать?
Давайте рассмотрим подробнее на нашем примере…
В первую очередь, это конечно же выход из строя одного или более дисков. Как мы знаем, на сегодняшний день максимальными по объему все еще являются диски с механическим вращением шпинделя, а именно HDD диски. Но, как и любая механика, они имеют свой ресурс. Безусловно, производители стараются закладывать этот ресурс как можно больше и в теории цифры показывают очень неплохой запас (до 2-х млн.
Итак, что же делать, если у нас вышел из строя один HDD диск, при условии что мы используем RAID 5? Ответ напрашивается сам – как можно скорее заменить этот диск. Но что произойдет с нашими данными? А вот тут как раз и начинает работать смысл создания массива. Как мы знаем RAID 5 у нас идет с избыточностью в один HDD, что позволяет выйти из строя любому диску в массиве без потери данных. То есть с нашими данными ничего не случится, они так же будут доступны на запись и чтение, но массив перейдет в аварийный режим («понижено»).
При этом NAS будет сигнализировать об этом длинным звуковым сигналом, а также индикацией на дисплее.
Для того чтобы вернуть массив в нормальное состояние нет необходимости останавливать или выключать устройство. Все делается на «горячую», т.е. просто извлекается испорченный HDD, а вместо него ставится новый . При этом автоматически запустится процесс восстановления массива, по окончании которого, RAID перейдет в свое обычное состояние («Исправен»).
Почему не стоит затягивать с заменой HDD, если RAID массив перешел в аварийный режим?
Дело в том, что в этом режиме у нас создается большая нагрузка на сам HDD, и если оставить процесс в таком состоянии, возникает риск выхода из строя еще одного диска, и как следствие – полная потеря данных. Чтобы этого избежать, рекомендуется держать в запасе хотя бы 1 HDD, на случай замены.
При этом диск на замену можно держать и в самом устройстве, если вы не используете все корзины сразу. В чем смысл такого хранения? В том, что система будет сама подхватывать его автоматически, в случае выхода из строя диска из состава массива. Это довольно удобно автоматизирует процесс и еще больше повышает надежность. Настраивается эта функция очень просто. Заходим в уже знакомый нам раздел «Управление RAID» -> «Редактировать» и отмечаем диск как резервный.
Всё, функция настроена!
Как быть, если мы уже настроили массив, но нам необходимо его расширить или изменить?
Для этого в Web-интерфейсе Thecus есть функция «Миграция RAID» , которая как раз и предназначается для различных манипуляций с массивами, в том числе и изменения уровня RAID. В меню «Настройка RAID» необходимо открыть вкладку «Миграция RAID» и отметить свободный диск. Затем выбрать тип миграции. Так как мы просто расширяем массив, без изменения уровня, выбираем RAID5 -> RAID5 и нажимаем кнопку «Применить».
Запустится процесс миграции, по окончании которого диск будет добавлен в массив. При этом миграция займет некоторое время (от одного часа и более, в зависимости от объема HDD), но будет осуществляться в on-line формате, то есть все данные будут доступны в обычном режиме.
Как видим, ничего сложного в процессе создания и изменения RAID массива нет. Разработчики Thecus постарались сделать интерфейс максимально дружелюбным к пользователю и, как нам кажется, у них это неплохо получилось.
Узнайте больше!
- Как сэкономить на сервере?
- Сколько времени займет настройка системы ВКС?
Подпишитесь и узнайте!
Заполните форму, и мы доставим свежий выпуск Ef-office на ваш e-mail.
Быстрый программный RAID для СХД
Обеспечивает минимальную просадку производительности массива при отказе дисков и существенно сокращает время ребилда
Высокая скорость расчета контрольных сумм
В основе наших решений лежит программный RAID, способный производить расчет контрольных сумм быстрее, чем любые аналогичные решения в индустрии. RAID-массив читает и записывает блоки четности с рекордной скоростью (около 25 ГБ/с на 1 ядро процессора), что позволяет сохранить высокую производительность массива даже в режиме восстановления.
При отказе диска на последовательных запросах снижение скорости чтения с массива не составит более 10%, что значительно меньше, чем у любой другой системы хранения данных.
Сокращение времени ребилда RAID-массива
Ребилд (реконструкция, восстановление) RAID-массива после отказа накопителя — это потенциально опасный промежуток времени, который может принести администратору СХД массу неудобств.
Во-первых, восстановление данных на новый диск обычно ощутимо снижает общую производительность массива. Во-вторых, повышается вероятность потери данных, так как число допустимых для отказа накопителей в массиве уже как минимум на 1 меньше. Например, RAID 5 в такой ситуации уже не будет защищен контрольными суммами, и повторный отказ будет иметь фатальные последствия. В-третьих, появляется шанс наткнуться на ошибку чтения с поверхности диска (bad block), так как пересчитываются все диски и происходит обращение к редко запрашиваемым данным.
В большинстве случаев массив продолжает свою работу во время ребилда, поэтому для восстановления данных выставляется приоритет нагрузки, в среднем от 10 до 30 процентов вычислительной мощности. Чем ниже будет выставлен приоритет и чем больше емкость накопителей, тем длительнее будет процесс восстановления. В разных ситуациях он может занимать от нескольких часов до нескольких дней.
Благодаря быстрому расчету контрольным сумм RAID-массив в RAIDIX позволяет значительно сократить время ребилда по сравнению с существующими на рынке решениями.
Сравнение длительности ребилда RAID 6 программного массива RAIDIX и существующего аппаратного RAID-контроллера для накопителей из 15 и 30 накопителей.
Приоритет реконструкции 15%, объем накопителей 10 ТБ.
Уникальный механизм вычислений
Механизм быстрой работы программного массива RAIDIX основан на оригинальном подходе к векторизации вычислений с расширениями SSE и AVX процессоров Intel при использовании RS-кодов. Ключевая идея этого подхода заключается в особом размещении данных в векторных регистрах, при котором существенно увеличивается скорость кодирования и декодирования данных.
Сравнение скорости кодирования и декодирования на примере RAID 6. Значения RAIDIX сравниваются с результатами библиотек ISA-L (Intel) и Jerasure.
Возможности программного RAID-массива
Способность быстро кодировать и декодировать данные позволяет нашему RAID-массиву обеспечивать стабильный уровень производительности, необходимый для бесперебойной работы бизнес-приложений. С этой технологией отказ одного или нескольких накопителей не приводит к просадке производительности и не прерывает выполнение текущих задач.
Особое значение это имеет для высоконагруженных систем и инфраструктур с большими объемами хранения, где отказ даже одного накопителя подразумевает пересчет контрольных сумм для большого количества данных.
В RAIDIX был разработан целый ряд технологий, использующих преимущества быстрого RAID-массива и позволяющих заметно повысить пользовательские характеристики СХД.
RAID 7.3
RAID-массив с тремя контрольными суммами практически не уступает по производительности RAID 6 на последовательных нагрузках, но при этом демонстрирует колоссальную надежность.
Подробнее >
RAID N+M
Возможность создавать RAID-массив с самостоятельным назначением количества накопителей (до 32) под контрольные суммы.
Упреждающая реконструкция
Возможность быстро читать данные из контрольных сумм для сохранения скорости работы массива, исключая из процесса чтения наиболее медленные накопители.
Подробнее >
Частичная реконструкция
Сокращение времени на восстановление данных массива при случайном или запланированном извлечении накопителя.
Подробнее >
Защита от скрытого повреждения данных
Благодаря высокой скорости массива система может сканировать целостность данных при помощи контрольных сумм практически без снижения производительности.
Подробнее >
Материалы
Узнайте больше о преимуществах систем хранения данных на базе RAIDIX
НА СТРАНИЦУ ПРОДУКТА
Общие сведения о производительности RAID на различных уровнях
Выбор уровня RAID — это попытка сбалансировать множество факторов, включая стоимость, надежность, емкость и производительность. Производительность RAID может быть сложной для понимания, в основном потому, что разные уровни RAID используют разные методы и на практике ведут себя несколько по-разному. В этой статье мы рассмотрим стандартные уровни RAID 0, 5, 6 и 10, чтобы увидеть, как отличается их производительность. В этой статье предполагается, что RAID 1 является подмножеством RAID 10. Проще говоря, RAID 1 аналогичен массиву RAID 10, за исключением того, что он включает только один элемент зеркальной пары. Поскольку RAID 1 на самом деле представляет собой RAID 10 с одной парой и ведет себя соответствующим образом, это прекрасно работает для упрощения понимания производительности RAID. Он просто отражает кривую производительности RAID 10.
RAID Чтение, запись 101
Существует два типа производительности всех систем хранения: чтение и запись. Что касается RAID, чтение простое, а запись довольно сложная. Производительность чтения эффективно стабильна для всех типов. Писать, однако, нет. Чтобы упростить обсуждение производительности, нам нужно определить несколько терминов, поскольку мы будем работать с некоторыми уравнениями. В наших обсуждениях мы будем использовать «N» для представления общего количества дисков в нашем массиве, часто называемых шпинделями. Мы будем использовать «X» для обозначения производительности каждого диска в отдельности. Это позволяет говорить об относительной производительности как факторе производительности накопителя.
Мы можем абстрагироваться от массива RAID, не думая о необработанных IOPS (операциях ввода/вывода в секунду). Это важно, так как IOPS часто очень трудно определить. Но мы можем осмысленно сравнить производительность, говоря о ней по отношению к отдельным дискам в массиве. Также важно помнить, что речь идет только о производительности массива, а не всей подсистемы хранения. Артефакты, такие как кэши памяти и твердотельные кэши, будут творить удивительные вещи, изменяя общую производительность подсистемы хранения. Но кардинально производительность массива под капотом они не изменят.
Не существует простой формулы для определения того, как различные параметры кэша повлияют на общую производительность. Достаточно сказать, что это может быть очень драматично, в значительной степени в зависимости от выбора кэша и рабочей нагрузки. Даже самые большие, самые быстрые и надежные варианты кэш-памяти не могут изменить долговременную и устойчивую производительность массива. RAID является сложным, и многие факторы влияют на конечную производительность. Одним из них является реализация самой системы. Плохая реализация может вызвать задержку. Или он может не использовать доступные шпиндели (например, когда массив RAID 1 считывается только с одного диска, а не с обоих одновременно). Нет простого способа учесть недостатки в конкретных реализациях. Мы должны предположить, что все работают в пределах спецификации. Для этого подойдет любая корпоративная система RAID. В первую очередь это любительские и потребительские RAID-системы, которые терпят неудачу в этом аспекте.
Роль процессора в производительности RAID
Некоторые типы RAID также имеют удивительно большие вычислительные затраты, в то время как другие — нет. Прежде всего, уровни RAID с четностью требуют интенсивной обработки для обработки операций записи, при этом разные уровни требуют разного объема вычислений, необходимых для каждой операции. Это приводит к задержке, но не снижает пропускную способность. Однако эта задержка будет варьироваться в зависимости от реализации уровня RAID, а также от вычислительных возможностей системы. Аппаратный RAID будет использовать ЦП общего назначения (часто процессор Power или ARM RISC) или специальный ASIC для обработки этого. ASIC могут быть очень быстрыми, но дороги в производстве. Программный RAID передает это центральному процессору сервера. Обычно процессор сервера здесь быстрее, но потребляет системные ресурсы.
Эта задержка влияет на производительность системы хранения, но ее очень трудно предсказать, и она может варьироваться от номинальной до существенной. Поэтому я упомяну об относительном влиянии задержки для каждого уровня RAID, но не буду пытаться его измерить. В большинстве расчетов производительности RAID эта задержка игнорируется. Тем не менее, он все еще присутствует. В зависимости от конфигурации массива это может оказать заметное влияние на рабочую нагрузку. Следует отметить, что операции чтения оказывают небольшое влияние на производительность из-за эффективности размещения данных на самом диске.
Parity RAID требует данных на дисках, которые бесполезны во время исправной операции чтения, но не могут быть использованы для ее ускорения. Это приводит к тому, что он немного медленнее. Но это влияние минимально и обычно не измеряется, поэтому им можно пренебречь. Конечно, такие факторы, как размер полосы, также влияют на производительность. Но поскольку это настраивается, а не является внутренним артефактом на любом уровне, мы проигнорируем его здесь. Это не фактор при выборе самого уровня RAID, а только при его настройке после выбора.
Соотношение операций чтения/записи для хранилища
Последний фактор, о котором мы хотим упомянуть, — это соотношение операций чтения и записи операций хранения. Некоторые массивы RAID будут использоваться почти исключительно для операций чтения, некоторые — для операций записи. Большинство из них будет использовать сочетание этих двух способов, вероятно, что-то около 80 процентов чтения и 20 процентов записи. Это соотношение имеет решающее значение для понимания производительности, которую вы получите от вашего конкретного массива, и понимания того, как каждый уровень RAID повлияет на вас. Мы называем это смесью чтения/записи. Мы измеряем производительность хранилища в первую очередь в IOPS. IOPS означает количество операций ввода/вывода в секунду. Мы используем термины RIOPS для чтения IOPS, WIOPS для записи IOPS и BIOPS для смешанного IOPS, что соответствует соотношению 80/20. Многие говорят о производительности хранилища с одним числом IOPS. Когда это делается, они обычно имеют в виду смешанные операции ввода-вывода в секунду при соотношении 50/50.
Однако любая рабочая нагрузка редко работает с соотношением 50/50, поэтому это число может вводить в заблуждение. Нам нужны два числа, RIOPS и WIOPS, чтобы понять производительность. Мы можем использовать их вместе, чтобы найти любое сочетание IOPS, которое нам нужно. Например, смесь 50/50 так же проста, как (RIOPS * 0,5) + (WIOPS * 0,5). Более распространенная смесь 80/20 будет (RIOPS * 0,8) + (WIOPS * 0,2).
Теперь, когда мы установили некоторые критерии и справочные сведения, мы углубимся в наши уровни RAID и посмотрим, как производительность зависит от них. Для всех уровней RAID мы рассчитываем количество IOPS при чтении с помощью NX. Конечно, это не касается номинальных накладных расходов, упомянутых выше. Это число «наилучшего случая». Но реальное число настолько близко, что использовать эту формулу практично. Возьмите количество шпинделей (N) и умножьте на производительность IOPS отдельного диска (X). Имейте в виду, что диски часто имеют разную производительность чтения и записи. Поэтому обязательно используйте показатель IOPS при чтении или протестированную скорость диска для расчета IOPS при чтении и показатель IOPS при записи или протестированную скорость для расчета IOPS при записи. Подробнее: Практическое принятие решений по RAID
Производительность RAID 0
RAID 0 — самый простой для понимания уровень, поскольку практически не нужно беспокоиться о накладных расходах или ресурсах, потребляемых для его питания, а как чтение, так и запись получают все преимущества каждого шпинделя. Таким образом, для RAID 0 наша формула производительности записи проста: NX.
RAID 0 всегда является самым высоким уровнем производительности. Примером может служить массив RAID 0 с восемью шпинделями. Если отдельный диск в массиве обеспечивает 125 операций ввода-вывода в секунду, наши расчеты будут выполняться с N = 8 и X = 125, поэтому 8 * 125 дает 1000 операций ввода-вывода в секунду. И чтение, и запись IOPS здесь одинаковы. Так что элементарно, так как мы получаем 1K RIOPS, 1K WIOPS и 1K без всякого смешивания. Если бы мы не знали абсолютных значений IOPS для отдельного шпинделя, мы могли бы назвать восьмишпиндельный массив RAID 0 обеспечивающим 8-кратный смешанный IOPS.
Производительность RAID 10
RAID 10 — второй по простоте уровень вычислений. Поскольку RAID 10 представляет собой чередование наборов зеркал RAID 0, нам не о чем беспокоиться из-за чередования, но каждое зеркало должно дважды записывать одни и те же данные для создания зеркального отображения. Это вдвое снижает производительность записи по сравнению с массивом RAID 0 из того же количества дисков. Это дает нам простую формулу производительности записи: NX/2 или 0,5NX. Следует отметить, что это основано на той же емкости, что и RAID 0, а не на том же количестве шпинделей.
RAID 10 имеет ту же производительность записи, что и RAID 0, но удваивает производительность чтения, поскольку для достижения той же емкости требуется в два раза больше шпинделей. Таким образом, массив RAID 10 с восемью шпинделями будет иметь N = 8 и X = 125, и наш результирующий расчет получается (8 * 125)/2, что составляет 500 WIOPS или 4X WIOPS. Сочетание 50/50 даст 750 смешанных операций ввода-вывода в секунду (1000 операций ввода-вывода в секунду при чтении *.5 и 500 операций ввода-вывода в секунду при записи *.5). Эта формула в равной степени применима к RAID 1, RAID 10, RAID 100 и RAID 01. зеркалирование в RAID 10 изменило бы этот штраф за запись. Например, RAID 10 с тройным зеркалированием будет NX/3. Подробнее: Понимание и использование RAID 10
Производительность RAID 5
RAID 5 устарел и никогда не должен использоваться в новых массивах. Я включаю его здесь, потому что это хорошо известный и часто используемый уровень RAID, и его производительность необходимо понимать. RAID 5 является самым базовым из текущих уровней RAID с контролем четности. RAID 2, 3 и 4 больше не используются в производственных системах, поэтому мы не будем здесь рассматривать их производительность. RAID 5, хотя и не рекомендуется для использования в настоящее время, является основой других современных уровней RAID с контролем четности.
Parity RAID добавляет несколько сложную необходимость проверки и перезаписи четности при каждой записи на диск. Это означает, что массив RAID 5 должен будет прочитать данные, прочитать контроль четности, записать данные и, наконец, записать контроль четности. Четыре операции на каждую эффективную. Это дает нам штраф за запись на RAID 5 из четырех. Таким образом, формула производительности записи RAID 5 — NX/4.
Итак, следуя примеру с восемью шпинделями, где скорость записи IOPS для отдельного шпинделя равна 125, мы получим следующий расчет: (8 * 125)/4 или 2X Write IOPS, что дает 250 WIOPS. В сочетании 50/50 это даст 625 смешанных операций ввода-вывода в секунду.
Производительность RAID 6
RAID 6, после RAID 10, вероятно, является наиболее распространенным и полезным уровнем RAID, используемым сегодня. Однако RAID 6 основан на RAID 5 и имеет другой уровень четности. Это делает его значительно более безопасным, чем RAID 5, что очень важно, но также налагает серьезные штрафы за запись. Каждая операция записи требует, чтобы диски считывали данные, считывали первую четность, считывали вторую четность, записывали данные, записывали первую четность и, наконец, записывали вторую четность. Получается, что штраф за запись составляет шесть, что довольно драматично. Наша формула NX/6.
Продолжая наш пример, мы получаем (8 * 125)/6, что дает ~167 операций ввода-вывода в секунду при записи или 1,33X. В нашем примере со смешанными операциями 50/50 это составляет 583,5 смешанных операций ввода-вывода в секунду. Как видите, записи с четностью вызывают очень быстрое снижение производительности записи и заметное снижение смешанной производительности.
Производительность как фактор емкости
При составлении формул производительности RAID мы думаем о них с точки зрения количества шпинделей, что невероятно разумно. Это очень полезно при определении производительности предлагаемого или даже существующего массива, где измерение невозможно, и позволяет нам сравнить относительную производительность между различными предложенными вариантами.
Именно в этих терминах мы обычно думаем о производительности RAID. Однако это не всегда хороший подход, потому что мы обычно рассматриваем RAID как фактор емкости, а не производительность или количество дисков. Было бы очень редко, но, безусловно, возможно, чтобы кто-то рассматривал массив RAID 6 с восемью дисками вместо массива RAID 10 с восемью дисками. Время от времени это происходит из-за ограничений шасси или по какой-либо другой аналогичной причине. Но обычно мы рассматриваем массивы RAID с точки зрения общей емкости массива (например, емкости, которую мы можем использовать), а не количества дисков, производительности или любого другого фактора.
Поэтому странно, что мы должны переключиться на рассмотрение производительности RAID как функции количества шпинделей. Если мы изменим нашу точку зрения и обратимся к емкости как к общему фактору — при этом по-прежнему предполагая, что емкость и производительность (X) отдельных дисков остаются постоянными между компараторами, — то мы придем к совершенно другому ландшафту производительности. При этом мы видим, например, что RAID 0 больше не является самым производительным уровнем RAID и что производительность чтения резко меняется, а не остается постоянной.
Производительность — вещь непостоянная, но мы можем определить количество шпинделей, необходимое для достижения желаемой производительности. Это значительно упрощает дискуссию. Итак, наш первый шаг — определить количество шпинделей, необходимое для сырой емкости. Если нам нужна емкость 10 ТБ и мы используем диски емкостью 1 ТБ, нам потребуется, например, десять шпинделей. Или, если нам нужно 3,2 ТБ и мы используем диски емкостью 600 ГБ, нам потребуется шесть шпинделей.
Мы будем, в отличие от предыдущего, обозначать количество шпинделей как «R». (Здесь мы используем букву «R», чтобы обозначить, что это показатель необработанной емкости, а не общее количество шпинделей.) Как и прежде, производительность отдельного диска представлена как «X». RAID 0 остается простым. Производительность по-прежнему RX, поскольку дополнительных дисков нет. И чтение, и запись IOPS — это просто NX.
RAID 10 имеет RX IOPS записи, но 2RX Read IOPS. Это драматично. Неожиданно, рассматривая производительность как фактор стабильной емкости, мы обнаруживаем, что RAID 10 удваивает производительность чтения по сравнению с RAID 0!
RAID 5 немного сложнее. Количество операций ввода-вывода в секунду при записи будет выражаться как (R + 1) * X)/4. Число операций ввода-вывода в секунду при чтении выражается как (R + 1) * X). RAID 6, как мы и ожидали, следует схеме, которую проектирует RAID 5. Запись IOPS для RAID 6: (R + 2) * X)/6. А количество операций ввода-вывода в секунду при чтении выражается как (R + 2) * X).
Эта выгодная точка зрения меняет наше представление о производительности, и, если смотреть исключительно на производительность чтения, RAID 0 становится самым медленным уровнем RAID, а не самым быстрым, а RAID 10 становится самым быстрым как для чтения, так и для записи независимо от значений. для R и X!
Давайте возьмем реальный пример из 10 дисков по 2 ТБ, чтобы получить 20 ТБ полезной емкости, при этом каждый диск имеет производительность 100 IOPS, и предположим, что соотношение 50/50. Результирующий показатель IOPS будет следующим: RAID 0 с 1000 смешанных операций ввода-вывода в секунду, RAID 10 с 1500 смешанных операций ввода-вывода в секунду (2000 RIOPS / 1000 WIOPS), RAID 5 с 687,5 смешанных операций ввода-вывода в секунду (1100 RIOPS / 275 WIOPS) и RAID 6 с 700 смешанных операций ввода-вывода в секунду (1200 операций ввода-вывода в секунду). RIOPS / 200 WIOPS). RAID 10 здесь лидирует.
Задержка и влияние на систему программного RAID
Как мы уже отмечали ранее, RAID 0 и RAID 10 фактически не требуют учета системных издержек. По сути, операция зеркального отображения не требует вычислительных усилий и неизмеримо мала для всех намерений и целей. RAID с четностью требует дополнительных вычислительных ресурсов, что приводит к задержке на уровне хранения и потреблению системных ресурсов. Конечно, эти ресурсы предназначены для массива RAID, если мы используем аппаратный RAID. У них нет другой функции, кроме как быть поглощенными в этой роли. Однако, если мы используем программный RAID, это системные ресурсы общего назначения (в основном ЦП), потребляемые для обработки массива RAID. Влияние на очень маленькую систему с большим объемом RAID по-прежнему минимально, но его можно измерить, и его следует учитывать, хотя бы в незначительной степени. Задержка и влияние на систему напрямую связаны друг с другом. Не существует простого способа указать задержку и влияние на систему для разных уровней. Вот как мы можем выразить это:
- RAID 0 и RAID 10 практически не имеют задержки или влияния.
- RAID 5 имеет некоторую задержку и влияние
- RAID 6 имеет примерно вдвое большую задержку вычислений и влияние, чем RAID 5
Во многих случаях эта задержка и влияние на систему будут настолько малы, что их невозможно измерить стандартными системными инструментами . По мере того, как современные процессоры становятся все более мощными, задержка и влияние на систему будут продолжать уменьшаться. Примерно с 2001 года воздействие считается незначительным для систем RAID 5 и RAID 6, даже на недорогом товарном оборудовании. В сильно загруженных системах с большим объемом операций RAID с контролем четности может возникнуть конфликт между подсистемой RAID и другими процессами. требующие системных ресурсов.
Какая конфигурация RAID лучше всего подходит для вашего сервера?
RAID (избыточный массив недорогих дисков) — это технология виртуализации хранения данных, которая объединяет несколько дисков в один логический блок для повышения производительности, лучшего переключения оборудования при отказе и повышения надежности дискового ввода-вывода. Давайте рассмотрим некоторые распространенные вопросы, касающиеся RAID, и выясним, какая конфигурация RAID лучше всего подходит для вашего сервера.
Нужен ли моему серверу RAID?
Прежде всего, спросите себя, нуждается ли ваш сервер в настройке RAID. Развертывание RAID зависит главным образом от того, насколько важно время безотказной работы для ваших операций. Если важно оставаться в сети, RAID — ваша страховка от отказа.
Вот кошмарный сценарий: ваш жесткий диск выходит из строя (жесткие диски всегда выходят из строя, просто вопрос времени, будем надеяться, что это не Киберпонедельник).
Без установленного RAID ваш сервер и бизнес будут страдать от простоя, пока диск реконфигурируется и заменяется. Затем необходимо восстановить резервные копии; все это может занять 5 или более часов легко.
При установленном RAID диск будет заменен, и вы сможете перестроить и синхронизировать RAID со старого диска на новый диск, а также не потребуется восстановление из резервной копии.
Аппаратный и программный RAID
Существует два типа RAID, каждый из которых имеет свои преимущества и недостатки.
Аппаратный RAID: При настройке аппаратного RAID диски подключаются к плате контроллера RAID, вставленной в материнскую плату сервера.
Программный RAID: Когда диски подключены к материнской плате сервера без контроллера RAID, конфигурация управляется программным обеспечением операционной системы. Это более дешевый вариант; все, что вам нужно сделать, это подключить диски и настроить ОС. Однако вы ограничены уровнями RAID, которые может поддерживать ваша ОС.
Аппаратный RAID обеспечивает большую гибкость за счет дополнительных параметров конфигурации и освобождает вас от ограничений программного RAID. В зависимости от сложности вашей конфигурации RAID производительность может быть проблемой, если вы используете программный RAID.
Какая конфигурация RAID лучше?
Не все конфигурации RAID одинаковы с точки зрения избыточности, скорости или размера диска.
Некоторые общие уровни RAID включают RAID 0, RAID 1, RAID 5, RAID 10. Вот очень простая диаграмма TLDR. Читайте дальше для более подробной версии плюсов и минусов каждого из них.
RAID 0
- Резюме: RAID 0 чередует данные на уровне блоков на каждом из дисков в массиве. Поскольку данные распределяются по нескольким дискам, вы заметите повышение производительности чтения и записи, особенно для больших файлов. Это связано со способностью массива одновременно читать или записывать блок на каждый из дисков в массиве. Таким образом, производительность будет увеличиваться в зависимости от количества дисков в массиве. RAID 0 может содержать два или более дисков, при этом максимальное количество ограничено в зависимости от количества дисков, поддерживаемых вашим RAID-контроллером, и доступных дисковых отсеков для вашего сервера. Поскольку RAID 0 распределяет блоки хранения по всем дискам в массиве, любой сбой диска приведет к потере всего массива.
- Емкость: VD = (C * n) | VirtualDisk = (Емкость одного диска * количество дисков) Производительность ввода-вывода
- : значительно улучшена производительность чтения и записи
- Отказоустойчивость: нет, повышенный риск отказа, который зависит от количества дисков в массиве
RAID 1
- Резюме: RAID 1 зеркалирует данные на уровне блоков на двух дисках. Каждый раз, когда блок данных записывается в подсистему хранения, ваш RAID-контроллер будет записывать один и тот же блок данных на оба диска, обеспечивая отказоустойчивость в случае отказа одного из дисков. Из-за этого характеристики производительности ввода-вывода будут иметь несколько более низкую производительность записи по сравнению с одним диском, а производительность чтения будет почти вдвое выше, чем у одного диска. Это связано с тем, что когда контроллеру RAID необходимо записать данные, он должен сделать это на обоих дисках, однако, когда ему необходимо прочитать данные, он может одновременно получить два разных чтения с любого диска, поскольку набор данных на обоих дисках зеркалируется. Поскольку данные зеркально отображаются на обоих дисках в массиве, любой из дисков может выйти из строя, так как журнал как один остается работоспособным, не вызывая сбоя массива. ПРИМЕЧАНИЕ. Хотя большинство аппаратных RAID-контроллеров обычно поддерживают только два диска в массиве RAID 1, некоторые контроллеры и программные RAID-системы могут поддерживать более двух дисков. В этих случаях производительность записи будет немного снижаться по мере увеличения количества дисков, а производительность чтения будет увеличиваться вместе с количеством дисков.
- Емкость: VD = (C * n) / n | VirtualDrive = (Емкость одного диска * количество дисков) / количество дисков Производительность ввода-вывода
- : чуть более низкая производительность записи и почти вдвое выше производительность чтения .
- Отказоустойчивость: н/н
RAID 5
- Резюме: RAID 5 чередует данные на уровне блоков на каждом из дисков в массиве, а также вычисляет данные четности, которые распределяются по дискам в массиве для повышения отказоустойчивости. В массиве RAID 5 будет один набор четности, распределенный по всему массиву, что позволяет любому диску в массиве выйти из строя, не вызывая отказа массива. Поскольку распределенная четность должна содержать информацию о четности для информации, равной одному диску, необработанное пространство, предоставляемое массивом, будет равно общей емкости всех дисков минус емкость, равная одному диску. По этой же причине для RAID 5 требуется минимум три диска. Производительность ввода-вывода для RAID 5 обеспечивает улучшенную производительность чтения и записи, однако операции записи не будут масштабироваться так линейно, как RAID 0, поскольку контроллеру RAID необходимо выполнять расчет четности, а также сохранять полученные данные четности. ПРИМЕЧАНИЕ. Хотя некоторые программные RAID-системы поддерживают RAID 5, мы не рекомендуем это в производственной среде, поскольку все расчеты четности должны выполняться ЦП вашего сервера, а не выделенным специализированным аппаратным контроллером, предназначенным для ускорения вычислений такого типа. . Таким образом, программный RAID 5 будет масштабировать загрузку ЦП с дисковым вводом-выводом и часто может вызывать перегрузки по мере увеличения количества операций записи на диск.
- Емкость: VD = ( C * n ) – C | VirtualDrive = (Емкость одного диска * количество дисков) — Емкость одного диска
- Производительность ввода-вывода: улучшенная производительность чтения и записи
- Отказоустойчивость: n – 1
RAID 10
- Резюме: RAID 10 — это вложенный массив, содержащий наборы RAID 0 из RAID 1; другими словами, это массив RAID из нескольких массивов RAID. Таким образом, этот уровень RAID сочетает в себе некоторые характеристики производительности как RAID 0, так и RAID 1. Производительность ввода-вывода будет улучшена как для чтения, так и для записи, которые будут масштабироваться по-разному в зависимости от количества дисков в массиве. Производительность чтения зависит от количества дисков в массиве, а скорость записи зависит от количества наборов RAID 1 в массиве. Например, RAID 10 с четырьмя дисками будет иметь два набора RAID 1, которые затем станут частью RAID 0, поэтому производительность чтения будет почти в четыре раза выше для одного диска в массиве, а производительность записи будет почти в два раза выше, чем для одного диска в массиве. один диск. Этот уровень RAID предлагает отличное сочетание производительности и отказоустойчивости. Половина дисков в массиве может выйти из строя без отказа самого массива. Это связано с тем, что один диск в каждом из наборов RAID 1 может выйти из строя без отказа этого набора RAID. Из-за этих характеристик вы заметите, что минимальное количество требуемых дисков будет четыре, а общее количество дисков должно быть четным, так что увеличение количества дисков в массиве выполняется парами дисков. Хотя количество необходимых дисков по сравнению с чистой полезной емкостью ниже, этот уровень RAID обеспечивает наилучшее общее сочетание производительности и отказоустойчивости. Это отличный вариант для чтения больших баз данных или смешанных рабочих нагрузок.
- Емкость: VD = (C * n) / n | VirtualDrive = (Емкость одного диска * количество дисков) / количество дисков
- Производительность ввода-вывода: улучшенная производительность записи со значительно улучшенной производительностью чтения
- Отказоустойчивость: n / 2
Нужен ли моему RAID-массиву BBU?
BBU (блок резервного питания) — это физический ионно-литиевый аккумулятор, который подключается к RAID-контроллеру. Это устройство, которое защищает и поддерживает кэшированные данные, которые находятся на карте рейда вашего сервера.
Ваш сервер с «голым железом» теряет питание до того, как изменения покидают кэш и фиксируются на диске, что приводит к повреждению данных. Содержимое карты RAID становится невосстановимым, и вы можете не знать, какие файлы повреждены. По сути, BBU — это отказоустойчивость данных.
HostDime — один из немногих провайдеров центров обработки данных, который не только предлагает BBU для RAID-контроллеров, но и имеет специалистов, постоянно проверяющих батарею. HostDime использует интеллектуальную резервную батарею MegaRAID, которая сохраняет целостность данных в течение 72 часов. Если вы уже являетесь клиентом и у вас есть RAID, свяжитесь с нами, чтобы добавить MegaRAID BBU за 20 долларов в месяц.
Калькулятор RAID
Технические специалисты HostDime создали калькулятор RAID, который сравнивает и настраивает параметры RAID и размеры дисков для повышения производительности вашего сервера. Просто перетащите диски в слоты, чтобы увидеть описание каждого RAID, емкость диска, производительность дискового ввода/вывода, минимальное количество дисков, отказоустойчивость и многое другое.