Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

Приветствую всех! В данной статье я постараюсь разъяснить суть RAID массивов, их применение и область использования. Моя цель — изложить материал максимально простым языком, избегая излишнего использования специальных терминов.

Те, кто жил в 90-х, помнят, насколько медленны были процессоры того времени. В то время данные все так же хранились на жестких дисках, а скорость считывания была порядка 12 мс с периодическими задержками в 5 мс. Максимальное количество оборотов в минуту составляло 5000. С тех пор производительность процессоров выросла в десятки раз, но скорость жестких дисков увеличилась незначительно. Даже сейчас топовые HDD имеют примерно такие же характеристики, с небольшим увеличением оборотов до 10-12 000 в минуту.

В результате возникла ситуация, в которой процессор обрабатывает информацию очень быстро, но хранилище данных не успевает за такими вычислениями. Увеличить скорость обработки пока не представляется возможным. Именно поэтому перед инженерами стоит задача обеспечить быстрый доступ к базам данных, хранящимся на тех же физических носителях. Эту проблему решают рейд-массивы, о которых мы подробно расскажем в данной статье.

Принцип

Посмотрев на изображение ниже, вы легко сможете понять принцип работы RAID массивов. У нас имеется база данных, в которой определенные данные распределены не только на одном устройстве, но сразу на нескольких. Это означает, что вычислительные процессы одновременно обращаются к нескольким жестким дискам, получая несколько потоков данных. Благодаря этому скорость работы базы данных увеличивается в том числе, на сколько жестких дисков установлено в системе. Данная конфигурация называется — параллельным доступом к массиву (Parallel-Access Array).

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

Также имеется Independent-Access Array (массив с независимым доступом). Эта система необходима для обработки запросов с небольшим весом. В отличие от предыдущей версии, которая предназначена для обработки больших объемов данных, здесь происходит обработка мелкой информации, которую можно записать на одно устройство без разделения.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

Однако, у данных систем есть значительный недостаток: с увеличением числа дисков снижается надежность. Проще говоря, увеличивается вероятность выхода из строя хотя бы одного жесткого диска.

Однако этот недостаток устраняется с помощью специального дискового кодирования. Часто используется дублирование данных, что позволяет каждому диску хранить ровно половину своих данных, а вторую половину – дублировать на другом носителе.

История

Акроним RAID означает Redundant Arrays Of Inexpensive Disks, что переводится как «избыточные наборы недорогих дисков». Интересный факт заключается в том, что такой перевод был предложен в самом начале. Это связано с тем, что тогда были доступны недорогие диски, устанавливаемые на обычные ПК. Более дорогие диски устанавливались на более мощные компьютеры.

Однако недорогие диски были отказоустойчивыми и, в итоге, от них отказались. Тогда акроним был изменен на «Redundant Array Of Independent Disks» — избыточный массив независимых дисков. Эта система была разработана в Беркли в 1987 году и включала в себя так называемые уровни RAID:

  • RAID 0 — без отказа.
  • RAID 1 — зеркальный, где данные дублируются.
  • RAID 2 — массив с использованием кода Хемминга.
  • RAID 3, 4, 5 – применяют четный алгоритм для записи информации в определенном порядке. При этом код дублируется, но сохраняется в различных местах.

Недостатком RAID 3, 4, 5 является то, что система работает только при небольшом отказе. Для повышения отказоустойчивости в систему был добавлен кэш. Теперь, если дисковое пространство уже занято, данные записываются в кэш и ожидают своей очереди. Таким образом, система предотвращает потерю данных в случае простоя. В следующих разделах мы более подробно рассмотрим каждый вид RAID.

RAID 0

Это довольно простая система. У нас есть несколько винчестеров, которые напичканы информацией. Информация разделена между ними. То есть данные считываются одновременно со всех дисков, но вы уже знаете об этом. Система быстрая и дешевая, но она совсем неустойчива к отказам.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

RAID1

У каждого хранилища имеется брат-близнец, какой-то дубль. Если он перестанет функционировать, то будет работать зеркальный или дублированный массив. В итоге мы получаем высокую производительность и надежность, но высокую стоимость внедрения из-за необходимости приобретать в два раза больше дисков.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

RAID 2

Для обработки данных используется специальный алгоритм Хемминга, который обеспечивает быструю коррекцию ошибок на уровне двоичного кода. Однако существует проблема: хотя диски быстро передают данные, обработка занимает много времени. Поэтому подобные системы не подходят для обработки транзакций или аналогичной информации.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

RAID 3

Информация разделяется на сегменты и хранится на жестких дисках, а также на одном диске для проверки целостности данных. Именно этот диск используется для проверки данных всего сегмента.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

RAID 4

Здесь каждый винчестер сохраняет свою информацию. Эта система необходима, когда требуется одновременно обрабатывать данные с различных дисков, осуществляя быструю обработку небольших запросов. Большие объемы данных здесь не используются.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

RAID 5

По сути, это та же самая технология RAID4, но с возможностью одновременного использования нескольких данных с использованием последнего диска и контрольных секторов.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

0

RAID 6

Подобно системе РЕЙД (3, 4, 5), эта система также использует вторую схему для обнаружения отказов. В результате повышается надежность, но увеличивается задержка из-за необходимости отправить 6 запросов для извлечения нужных данных.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

1

RAID 10

Это, по сути, комбинированная система, объединяющая в себе преимущества RAID 1 и RAID 0, что и обусловило ее название. Она основана на обычной системе RAID 0, но с поддержкой второй системы жестких дисков – RAID 1.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

2

RAID30

По-моему, уже многие угадали, что здесь используется обычный РАЙД 0, а также несколько блоков поддержки РАИД 3. Одновременно система способна обрабатывать и большие объемы данных, и мелкие запросы с быстрым доступом.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

3

RAID 50

Для обработки запросов в данном случае используется RAID 5 вместо РЕЙД 3, что увеличивает скорость и повышает отказоустойчивость по сравнению с РЭЙД 30. Однако стоимость такой системы будет значительно выше.

Все виды RAID (0, 1, 2-5, 10-50): полный разбор массивов жестких дисков от Сисадминыча

4

RAID 7

Компания «Storage Computer Corporation (SCC)» разработала массив и является его владельцем. Эта система имеет множество преимуществ и незначительные недостатки. Все запросы обрабатываются независимо, поэтому диск способен принимать любой запрос в любое время.

Для уменьшения времени обработки запросов используется кэширование. Благодаря высокоскоростной шине скорость обработки запросов в 5 раз превосходит другие системы. Недостаток заключается в том, что эта система принадлежит одной компании. Таким образом, вы приобретаете ее за большие деньги, и не можете обслуживать ее самостоятельно, так как это занимаются сотрудники компании.

Оцените статью
Мои Советы
Добавить комментарий