Содержание
Всем доброго времени суток. Продолжаем погружение в мир компьютерного железа. Всем известно о том, что у компьютера есть жесткий диск, который можно сравнить с человеческой памятью – на нем хранится вся информация которая только есть. Устройства эти с каждым поколением становятся все быстрее и умеют хранить все больше данных.
Но, по прежнему значительная часть этих устройств подвержена риску потери информации. Пока значительная часть жестких дисков в силу своего устройства не умеет достаточно быстро записывать и считывать записанную информацию.
Скорость передачи данных отражается на производительности всего компьютера. Какой бы мощной не была его начинка – скорость работы диска ограничивает эту мощность. Есть ли способы как то повысить отказоустойчивость и повысить скорость? Да, есть и технологии эти придуманы давно.
Для чего нужны RAID массивы?
Слово “массив” – означает некое скопление однотипных предметов, или информации. Полку с книгами на определенную тематику можно назвать массивом. Старинную картотеку из деревянных ящичков то же.
Идея схожая – взять не один жесткий диск, а два или больше. Используя различные технологические решения можно добиться увеличения скорости чтения записи на диск, повысить их отказоустойчивость.
Особенно это актуально для серверных систем, систем работающих с большими базами данных, где скорость записи / чтения на диск критически важна. RAID – массивы призваны повысить производительность системы.
При этом хорошо, чтобы система еще отличалась бы надежностью и отказоустойчивостью. На практике бывает так, что когда один из дисков отказывает, его меняют,система восттанавливается. Все зависит от того, какую разновидность массива Вы будете использовать.
Многие удивятся, но еще в 1987 году Девид Петерсон со своей командой представил “резервный массив недорогих дисков”, наверное потому, что жесткие диски – это в общем то не такое уж дешевые устройства… Так и расшифровывается сегодня аббревиатура RAID “избыточный массив независимых дисков ”
Чем отличаются рейд – массивы друг от друга?
Отличий основных два. Первое отличие – это количество используемых жестких дисков в массиве. Вы покупаете два (или больше дисков) и одновременно подключаете их к компьютеру.
Подключать можно столько – сколько у вас на материнской плате разъемов для подключения. На блок питания компьютера так же стоит обратить внимание. Мощность и количество разъемов питания для подключения возможно придется увеличить.
Исходя из этого уже можно судить о том, какие массивы может поддерживать материнская плата вашего компьютера. Можно говорить о том, что все мало-мальски современные материнские платы поддерживают использование RAID. А вот ноутбуки – нет, там без вариантов только один жесткий диск.
Второе отличие – это технологии, которые используются при записи чтении данных. Жесткий диск – это магнитный носитель. То есть информация записывается на него так же, как и на старый магнитофон.
Изменились конечно технологии. У меня в 90-х годах был компьютер “Спектр”, там в качестве “жесткого диска” использовалась магнитофонная кассета и подключенный магнитофон.
Игра была записана на кассету. Перед тем как играть, нужно было для начала кассету “прослушать” – так загружалась игра в этот компьютер. Видел недавно у друга подобную вещь – ZX Spectrum, еще работает. Были времена…
А сегодня уже активно используются массивы из твердотельных жестких дисков. Жесткий диск стал еще “тверже”. Принцип их работы – как у большой флешки. Информация записывается не “на пластинку”, а в микросхемы устройства.
Скорость передачи данных , чтения и записи в таких устройств итак в разы выше,чем у обычных . И использование их в RAID массиве еще больше увеличивает производительность системы. Но, пока что один такой диск по цене – как два или три обычных.
Виды и назначение рейд массивов
Продолжим про технологии. Технологии создания массивов тоже различаются. Можно по разному использовать имеющиеся в наличии жесткие диски. Переходим непосредственно к существующим стандартам RAID. Есть базовые стандарты, и их комбинации. Сегодня расскажу только о базовых.
RAID -0 . Самый доступный и простой вариант, например из двух одинаковых по объему дисков. Данные записываются путем чередования. Информация разбивается на равные части и затем одна часть записывается на один диск, следующая часть на другой и так по очереди.
Скорость чтения записи возрастает в нашем случае в два раза. Если дисков в массиве три – то в три раза и т. д. Данные при таком варианте массива не резервируются.
Вероятность потери данных при отказе одного из дисков так же повышается в два раза. У меня есть компьютер с двумя дисками в RAID0. Плюс отдельно один диск, на который ежедневно скидывается копия системы. Вот я и решил применить дополнительные средства.
RAID1. В этом варианте можно использовать два или более дисков, которые являются полными копиями друг друга (зеркалом). Здесь скорость записи на диск такая же как обычно, хотя данные эти записываются сразу на все диски параллельно.
В случае отказа одного из дисков система будет работать. После замены отказавшего диска согласно программе на новом диске восстанавливается информация.
Можно построить “зеркало” из трех дисков. Соответственно, вероятность отказа уменьшается втрое, а скорость чтения увеличивается. Но тут мы проигрываем, теряя дисковое пространство – массив из двух (или трех) дисков получается по объему как один обычный.
RAID2. Эта схема мудренее предыдущих, в ней сочетаются принцип RAID -0 (для данных используются как минимум два диска). А на остальных записываются коды коррекции ошибок, с помощью которых можно восстановить информацию в случае отказа. Причем коррекция ошибок происходит в процессе работы системы. Беда в том, что дисков коррекции нужно довольно много. Параллельной записи нет.
RAID3 Массив можно сделать по минимуму – из трех дисков. Опять же, как в RAID -0 два или больше дисков используется для хранения данных. Причем данные разбиваются на маленькие порции – байты и записываются. Третий диск тоже используется как контрольный, на него записывается информация о блоках четности.
На этот диск приходится большая нагрузка, по этой причине он подвержен риску отказа. Скорость считывания данных падает, если работа идет с небольшими файлами и при многозадачной работе – данные раскиданы маленькими порциями, на считывание их уходит больше времени.
RAID4 отличается от предыдущего только тем , что данные разбиты на блоки данных, а не на байты. Скорость чтения несколько увеличивается. Так же используются контрольные диски, как во 2 и 3 стандартах. Параллельной записи нет.
RAID5 Интересная и экономичная комбинация. Нет контрольных дисков. Минимальное количество дисков – это три. Данные на диски записываются циклично. К примеру, один файл пишется сразу на все диски.
И его контрольная сумма вычисляется и записывается тоже на все диски по особому алгоритму. В случае повреждения, по контрольным суммам вычисляются недостающие данные и информация восстанавливается с соседних дисков.
При этом обеспечивается высокая скорость чтения и записи, так как эти операции идут параллельно по всем дискам. При увеличении количества дисков повышается отказоустойчивость. Недостаток – система медленно восстанавливается в случае повреждения. Есть повышенный риск выхода из строя дисков массива в процессе восстановления данных.
RAID6 отличается от предыдущего варианта наличием контрольных дисков. На два диска данных подключается три контрольных. Запись ведется по особому коду. Повышена надежность, но несколько снижена производительность по сравнению с RAID 5.
Итак, слегка пробежавшись по базовым стандартам мы видим, что есть только два “достойных” варианта, это RAID0 и RAID1 Один из них обеспечивает самую высокую скорость, другой – высокую надежность. Остальные базовые стандарты – это компромиссы между скоростью и надежностью.
И выбирать нужно исходя из потребностей. Основное назначение массивов – повышение скорости и отказоустойчиовсти в процессе работы. Есть и распространенные комбинации базовых вариантов. Одной из таких является стандарт RAID 1,0.
RAID 1,0 (1+0) Если у Вас есть задумки развернуть к примеру сервер 1с или любой другой сервер баз данных, то комбинация RAID 1,0 то, что надо. Нужно будет использовать как минимум 4 (или восемь) дисков в массиве.
Это дорого, зато оправдывает затраты тем, что обеспечивается высокая скорость чтения записи данных на диски, как в схеме RAID0. На каждый диск с данными есть зеркало, как в схеме RAID1.
Какие HDD (жесткие диски) можно подключить в RAID
В первую очередь – заведомо исправные. Перед подключением нужно проверить у диска S.M.A.R.T, если есть сомнения. Диски с деградирующей поверхностью подключать ни в коем случае нельзя.
Идеально, когда покупаются новые диски. Рекомендуют покупать диски одной и той же фирмы, одной и той же марки, чтобы не сильно отличались базовые технические характеристики.
В противном случае может получиться, что нагрузка на один диск больше, чем на другой. Никогда не подключал в RAID диски разной емкости. Предполагаю, что какая-то часть дискового пространства потеряется, и не будет использоваться.
Новые диски могут различаться по энергопотреблению, скорости, объемом буферной памяти и предназначению. Крайне желательно, чтобы все эти показатели были одинаковыми. Может получиться так, что самый слабый диск будет замедлять работу всей связки ввиду более низких характеристик.
В общем, брать новые и одинаковые. Самым продвинутым и дорогим на сегодня вариантом является объединение в RAID массив твердотельных жестких дисков. Если вы собираетесь модернизировать сервер в этом направлении – тут нужно брать специальные серверные версии таких устройств. Их ресурс значительно выше обычных.
На Линукс так же можно спокойно развернуть RAID, но для этого семейства полезно сначала изучить такие понятия как “псевдо RAID” и “soft-raid” (сильно зависит, на какое железо устанавливается ОС Линукс).
На момент написания статьи ведущим лидером среди производителей SSD (на нашем рынке) для сервера остается Intel. Цена на их устройства высока, но с качеством не прогадаете. Даже такой производитель как Hitachi пока не может похвастать особым выбором устройств SSD для серверов, по крайней мере у нас.