Главная arrow Термины arrow Техническое обеспечение автоматизированных систем arrow ДИСКОВЫЕ МАССИВЫ RAID, RAID [Redundant Array of Inexpensive/Independent Disks]

ДИСКОВЫЕ МАССИВЫ RAID, RAID [Redundant Array of Inexpensive/Independent Disks]

Дисковые массивы RAID - это, Что такое дисковые массивы RAID, Определение термина дисковые массивы RAID, RAID, Intel Matrix Raid, Горячая замена, Зеркальное дублирование, Зеркальный диск, Избыточное кодирование, Отказоустойчивость, Ударопрочность, Число циклов старт/стоп, Реконструкция, Скорость передачи, Среднее время поиска, Файловая система, Управление томом, Чередование, MTBF, MTBDL, MTDA, MTTF, MTTR, Recovery

1. Технология RAID впервые разработана в 1987 г. сотрудниками Калифорнийского университета в Беркли. Ее основная цель: обеспечение надежности хранения данных в дисковой памяти и повышение производительности ПК. Основные признаки технологии:
а) предполагает использование наборов дисков, доступных пользователям как один логический диск;
б) данные распределяются по набору дисков определенным способом, соответствующим одному из уровней RAID;
в) на случай неисправностей ("отказов") дисков массив содержит дополнительную ("избыточную") емкость, обеспечивающую возможность восстановления данных.
2. Набор спецификаций устройств хранения данных связан с уровнями RAID, определяющими способы распределения данных на дисковом массиве, их резервирования и восстановления.
3. Архитектура RAID, которая определяет различные способы объединения нескольких жестких дисков в единую систему так, чтобы она функционировала как один диск. Совместная работа дисков в массивах RAID организуется с применением параллельного или независимого доступа. В соответствии с разными типами доступа к записи и считыванию данных существуют различные типы RAID-массивов. Кроме того уровни RAID различаются способами формирования и размещения избыточных данных. Последние могут находиться либо на специально выделенном диске, либо распределяться между всеми дисками. Простейшим из этих способов является полное дублирование (избыточность = 100%) или зеркалирование. Примером является конструкция накопителей с зеркальными дисками. Изначально было определено шесть уровней RAID, позднее появились дополнительные смешанные уровни (всего определено 8 уровней), а также их комбинации.
В зависимости от того, как осуществляется управление, массивы RAID делятся на две категории —с программным контролем и аппаратным. Последние в свою очередь различаются расположением управляющего аппаратного обеспечения: внешний, либо встроенный хост-контроллер (такую конфигурацию иногда называют SCSI-to-SCSI).
Расширенный массив (батарея) недорогих независимых дисков.
Типы RAID-массивов
 - RAID 0 —дисковый массив без дополнительной отказоустойчивости: поток данных разбивается на блоки, которые последовательно записываются на диски. Основные достоинства: простота конструкции и изготовления, высокая производительность. Недостатком является низкая отказоустойчивость (выход из строя одного из дисков приводит к потере всех данных, хранящихся в дисковом массиве).
 - RAID 1 — дисковый массив с зеркалированием данных: блок данных записывается в двух экземплярах на отдельные диски. Достоинства: скорость записи та же, что и для одного диска, высокая скорость восстановления данных, простота конструкции, единственный вид RAID-массивов, позволяющий получить отказоустойчивую дисковую подсистему на двух дисках. Недостаток: низкий коэффициент использования дискового пространства (отношение объема полезных данных к суммарному объему дискового массива), равный 0,5.
 - RAID 2 —дисковый массив, использующий Алгоритм Хамминга для проверки/восстановления данных: поток данных разбивается на "слова данный, каждое слово данных в свою очередь разбивается на биты, при этом количество бит в слове должно равняться количеству дисков с данными, биты последовательно записываются на диски с данными. Для каждого слова данных по Алгоритму Хамминга вычисляется слово ЕСС-кода (Error Checking/Correction Code) —"Кода для проверки/коррекции ошибок", по существу являющегося контрольной суммой, запись которой используется для проверки и исправления ошибок. Достоинства: высокая скорость исправления ошибок и передачи данных (последняя тем выше, чем больше количество дисков в массиве), коэффициент использования дискового пространства увеличивается с ростом числа дисков в массиве, относительная по сравнению с RAID 3, 4 и 5 простота контроллера. Недостатки: в случае малого размера "слова данный — очень низкий коэффициент использования дискового пространства.
 - RAID 3 —дисковый массив с вычислением контрольной суммы параллельно с передачей данных: поток данных разбивается на сегменты, которые записываются на диски, контрольная сумма вычисляется при выполнении операции записи и сохраняется на диске с данными контроля. Достоинства: очень высокая скорость чтения и записи данных, выход из строя одного диска незначительно влияет на общую производительность массива, высокий коэффициент использования дискового пространства. Недостатки: трудность реализации программными средствами, средняя сложность конструкции, программная реализация требует значительной вычислительной мощности.
 - RAID 4 —дисковый массив с независимыми дисками данных и общим диском для хранения контрольных сумм: массив данных делится на блоки, каждый блок данных целиком записывается на диск, запись производится последовательно по дискам, контрольная сумма (общая для всех блоков одного ряда) вычисляется во время операции записи данных, помещается на диск с контрольными данными и проверяется в процессе чтения. Достоинства: высокая скорость чтения данных и высокий коэффициент использования дискового пространства. Недостатки: наименьшая из всех RAID-массивов скорость записи, сложный и неэффективный алгоритм восстановления данных в случае выхода из строя одного из дисков.
 - RAID 5 —дисковый массив с независимыми дисками данных и равномерным распределением контрольных сумм между дисками: блоки данных последовательно записываются на диски, контрольная сумма для блоков одного ряда вычисляется во время записи, контрольные суммы размещаются последовательно по всем дискам. Достоинства: высокая скорость чтения и записи данных, высокий коэффициент использования дискового пространства. Недостатки: выход из строя одного из дисков оказывает заметное влияние на производительность, сложный конструктив контроллера, сложный алгоритм восстановления данных в случае выхода из строя одного из дисков. До настоящего времени RAID 5 наиболее часто использовался для построения дисковых массивов серверов, поскольку он характеризуется небольшой избыточностью и эффективной системой восстановления данных. Однако для развитых корпоративных систем с большим количеством дисковых устройств высокой емкости, объединенных в общие системы хранения данных нескольких серверов, этот режим стал опасен: при аварии одного из серверов может выйти из строя вся система.
 - RAID 6 — дисковый массив с независимыми дисками данных и двумя независимыми схемами контрольных сумм, распределенными между дисками: усовершенствованный вариант RAID 5, к которому добавлена еще одна схема контрольных сумм, независимая от первой. Достоинства: высокая скорость чтения данных и высокая отказоустойчивость. Недостатки: сложная конструкция контроллера, большая нагрузка на контроллер при вычислении контрольных сумм, очень малая скорость записи, низкий коэффициент использования дискового пространства (например, для массива из 5 дисков он равен — 0,6-0,8). По указанным причинам до недавнего времени ни одна из коммерческих фирм не производила дисковых подсистем этого типа. Однако расширенные возможности защиты данных, а также рост объема дисковых массивов и емкости самих дисков в условиях развития корпоративных систем с общей дисковой памяти делают эту технологию привлекательной. В частности, в своих процессорах ввода/вывода Intel ЮР 333 корпорация Intel предлагает реализацию алгоритмов RAID 6.
 - RAID 7 —дисковый массив с асинхронным вводом/выводом и высокой скоростью передачи данных: все операции ввода/вывода выполняются в асинхронном режиме т. е. все операции контролируются независимо от выполнения других, данные в процессе ввода/вывода кэшируются, управление массивом RAID 7 возложено на многозадачную операционную систему, благодаря которой каналы передачи данных контролируются в режиме реального времени. Массив RAID 7 может иметь до 12 внешних интерфейсов обмена данными, что позволяет подключать массив одновременно к нескольким компьютерам; поддерживается технология "горячей замены" вышедших из строя дисков, а также возможен мониторинг состояния и управление массивом в удаленном режиме. Преимущества: производительность выше в 1,25-6 раз, по отношению к RAID-массивам других типов; очень высокая скорость доступа к данным в многопользовательской среде; скорость чтения и записи увеличивается при увеличении числа дисков в массиве. Недостатки: высокая стоимость, массивы этого типа производит только одна фирма (Storage Computer).
 - RAID 10 —комбинация технологий RAID 1 и RAID 0. Достоинства: Имеет ту же отказоустойчивость, что и RAID 1, скорость записи и чтения несколько выше, чем у RAID 1.
 - RAID 30 —комбинация уровней RAID 3 и 0 для повышения производительности ПК.
 - RAID 50 —комбинация уровней RAID 5 и 0 для повышения производительности ПК.
 - RAID 53 —комбинация уровней RAID 3 и 0, при которой, если диски расположить схематически в виде прямоугольной матрицы, то столбцы будут составлять массивы RAID 3 (у некоторых производителей — RAID 5), а ряды — массивы RAID 0. Такой массив достаточно дорог в реализации, к тому же все шпиндели дисков должны быть синхронизованы, что ограничивает выбор дисков. Достоинства: имеет такую же отказоустойчивость, что и RAID 3, при несколько более высокой скорости чтения и записи. Недостатки: высокая стоимость, низкий коэффициент использования дискового пространства.
 - RAID 0/1 —комбинация уровней RAID 0 и 1, однако данные хранятся по меньшей мере на четырех дисках.
 - Intel Matrix Raid —технология построения на двух жестких дисках двух RAID-массивов, образующих два логических диска, которые обеспечивают высокую производительность, соответствующую RAID 0, и высокую надежность хранения данных, соответствующую RAID 1. Оба массива занимают на дисках выделенное для них пространство и работают независимо один от другого. Соотношения объемов массивов определяются пользователем. Данные, размещенные в разделе RAID 1, сохраняются при отказе одного из жестких дисков.
Термины, связанные с RAID-технологией и неисправностью технических устройств:
 - горячая замена [hot swapping] — процесс замены отказавшего накопителя в дисковом массиве на резервный без отключения питания и перезагрузки системы;
 - зеркальное дублирование [mirroring] — способ защиты данных путем создания одной или нескольких их копий на отдельном диске массива (применяется только в RAID уровня 1);
 - зеркальный диск [mirror disk] —диск, реализующий функции зеркального дублирования;
 - избыточное кодирование [redundancy] — способ защиты данных без их дублирования, сберегающий дисковое пространство (применяется в RAID уровней 2, 3, 4, и 5). В соответствии с этим способом с каждого накопителя производится выборка данных, над которыми выполняются логические операции, причем результирующие данные сохраняются на одном или нескольких дополнительных накопителях. В результате как бы составляется уравнение с четырьмя переменными, причем каждая переменная и решение хранятся на отдельных накопителях. При отказе дисковода с данными система производит перерасчет уравнения и выявляет недостающие биты (однако если откажут одновременно сразу два накопителя, то для восстановления утерянных данных информации будет недостаточно). В RAID уровня 5-контрольная информация записывается на все диски массива, а в RAID уровней 2, 3 и 4 —на специально выделенный для этой цели накопитель;
 - отказоустойчивость [fault tolerance]— характеристика устойчивости к повреждениям. Достигается за счет введения дополнительных (избыточных) компонент в системе хранения данных для сохранения работоспособности системы при сбое в работе ее важных составляющих узлов;
 - ударопрочность [G-shock rating] —параметр, определяющий способность дисковода или другого устройства противостоять тряске и ударам (большее число означает большую сопротивляемость ударам);
 - число циклов старт/стоп [CSS] — предполагаемое, гарантируемое или фактическое число включений накопителя, после которого головки могут повредить поверхность дисковых пластин;
 - реконструкция [rebuild, reconstruction] —восстановление поврежденных данных при помощи избыточного кодирования. Реконструкция диска процесс долгий (может занять несколько часов), поэтому хороший массив RAID должен уметь производить реконструкцию в "фоновом режиме" и одновременно выполнять текущую работу;
 - скорость передачи [transfer rate] —характеристика, которая обозначает скорость пересылки данных между ЭВМ и устройствами их хранения. Обычно выражается в количестве символов в секунду.
 - среднее время поиска [average seek time] —время, необходимое дисководу для перемещения головок в нужное место диска для нахождения затребованных данных;
 - файловая система [File System] — средство и технология организации хранилищ данных, обеспечивающие работу с файлами как с единой системой. Впервые понятие было введено в 1965 г. фирмой UNIX (UNIX File System, USF). Целью создания файловых систем является обеспечение возможности создания файлов на одном или нескольких устройствах, а также производство необходимых с ними действий, в том числе удалять их, открывать, читать, записывать и перезаписывать и т.д. В настоящее время понятие файловая система непосредственно связано с RAID-технологией.
 - управление томом, менеджер тома [Volume Management, VM] — средство и технология группирования дисковых и RAID-устройств, образующих файловую систему. Разработано в конце 1980-х годов фирмой UNIX.
 - чередование, расщепление [striping] — метод записи данных с разделением их на фрагменты, которые фиксируются на нескольких дисках массива RAID для ускорения процессов чтения/записи;
 - MTBF (Mean Time Between Failures) — "Среднее время безотказной работы".
 - MTBDL (Mean Time Between Data Loss) — "Среднее время между потерями данный определяется средним временем безотказной работы дискового массива, соответствует MTBF, применительно к устройствам RAID;
 - MTDA (Mean Time of Data Availability) — "Среднее время пригодности данный: характеристика, которая определяется, как вероятность одновременного отказа двух дисков массива RAID, разделенная на среднее время их замены и восстановления данных;
 - MTTF (Mean Time То Failure) — "Среднее время наработки на отказ" связано с MTBDL и определяет среднее время между отказами первого и второго дисков в дисковом массиве RAID;
 - MTTR (Mean Time То Recovery) — "Среднее время устранения неисправности"]
 - Recovery —процесс динамического восстановления данных с отказавшего диска с использованием данных, записанных на диске четности и других дисках.