Force online raid что это
Организация единого дискового пространства — задача, легко решаемая с помощью аппаратного RAID-контроллера. Однако следует вначале ознакомиться с особенностями использования и управления таким контроллером. Об этом сегодня расскажем в нашей статье.
Надежность и скорость работы дисковых накопителей — вопрос, волнующий каждого системного администратора. Несмотря на заверения производителей о качестве собственных устройств — HDD и SSD продолжают выходить из строя в самое неподходящее время, теряя драгоценные данные. Технология S.M.A.R.T. в большинстве случаев дает возможность оценить «здоровье» накопителя, но это не гарантирует того, что диск будет продолжать беспроблемно работать.
Предсказать выход диска из строя со 100%-ой точностью невозможно, поэтому следует предусмотреть вариант, при котором это не станет проблемой или причиной остановки сервисов. Использование RAID-массивов решает эту задачу. Рассмотрим три основных подхода, применяющихся для этой задачи:
- Программный RAID — наименее затратный вариант, но и наименее производительный. Массив создается средствами операционной системы, вся нагрузка по обработке данных «ложится на плечи» центрального процессора.
- Интегрированный аппаратный RAID (еще его часто называют Fake-RAID) — микрочип, установленный на материнскую плату, который берет на себя часть функционала аппаратного RAID-контроллера, работая в паре с центральным процессором. Этот подход работает чуть быстрее, чем программный RAID, но надежность у такого массива оставляет желать лучшего.
- Аппаратный RAID — это отдельный контроллер с собственным процессором и кэширующей памятью, полностью забирающий на себя выполнение всех дисковых операций. Наиболее затратный, однако, самый производительный и надежный вариант для использования.
История развития RAID
В самом начале развития компьютерных технологий все внимание было направлено на том, как сделать компьютеры максимально удобными для пользователя. В те времена не существовало понятия «персональный компьютер», так как наиболее часто компьютеры использовались в военной промышленности (но там совсем другая история, так как военная индустрия обладает своими наработками по безопасности информации и т.д.) и в больших корпорациях. Но в те времена функционал компьютеров был очень небольшим и с ними по большей части работали программисты.
Даже в 1970х годах, когда Apple и Microsoft начали свою деятельность – вопрос о безопасности данных не был на первом месте. Все изменилось с появлением и развитием интернета, который начал охватывать все больше и больше стран и позволял пользователям обмениваться информацией. Стоит также отметить, что к тому времени все уже привыкли к персональным компьютерам и поняли, что они способны сильно облегчить жизнь обрабатывая огромные массивы информации. С появлением цифровых фотоаппаратов и видеокамер для личного использования всем стало ясно, что персональные компьютеры так или иначе будут практически в каждом доме. После этого начался бум цифровой индустрии, который автоматически поднял вопрос о безопасности данных. Немало этому посодействовали большие компании, которые уже в те времена обладали большими серверами для хранения данных, от которых сильно зависел уровень их эффективности. Поэтому, в 1987 году были придуманы RAID массивы. Их главным заданием было избежание потерь важной информации и поскольку технология была эффективной и предлагала на выбор несколько вариантов защиты данных, в зависимости от потребностей пользователя – она быстро приобрела распространение. Примерно так выглядит блок дисков, объединенных в RAID:
Несмотря на то, что никакой стандартизации не проводилось – следующие уровни массива RAID были приняты как стандарт:
- RAID 1 – зеркальный массив, при использовании которого каждый диск является полной копией другого;
- RAID 2 – массив дисков, в котором используется код Хемминга;
- RAID 3,4 — дисковые массивы с чередованием и выделенным диском чётности;
- RAID 5 — дисковый массив с чередованием и отсутствием выделенного диска чётности;
- RAID 0 – дисковый массив, главным заданием которого является увеличение скорости записи/чтения данных и полностью отсутствует избыточность;
Все остальные типы RAID массивов (такие как RAID 10, RAID 50 и т.д.) построены на вышеперечисленных типах RAID и так или иначе используют их концепцию.
Использование массивов RAID оказалось настолько эффективным, что на сегодняшний день практически все современные хранилища данных (сервера, NAS и т.д.) используют RAID массивы в том или ином виде.
Однако, несмотря всю надёжность такого решения стоит отметить, что вероятность потери данных все же осталась (хоть и сильно снизилась) так как даже RAID массивы иногда выходят из строя. Это может происходить по многим причинам и для того, чтобы узнать больше информации на эту тему читайте следующий пункт этой статьи.
RAID 1
Чтобы создать RAID 1, вам необходимо ввести следующие команды одну за другой:
- list disk – для отображения подключенных дисков;
- select disk 0 — количество дисков, их которых создается зеркало;
- convert dynamic – преобразование диска в динамический.
- select volume 0 – выбрать нужный диск;
- add disk=1 – добавить нужный диск для зеркалирования.
После этого будет создан массив RAID 1.
Обновление прошивки
Например у вас обнаружилась проблема - не поддерживаются диски на 4TB Придется обновлять прошивку.
Внимание: Если ваш контроллер Adaptec в настоящее время использует прошивку версии 16501, или у вас есть массивы, которые изначально были созданы под версией 16501, обязательно прочитайте это до выполнения обновления.
ВАЖНО! Adaptec предупреждает, что никакой ответственности за сбои во время прошивки не несет и можно потерять всю информацию.
Cделайте бэкап ценных данных и проводите прошивку только при подключенном ИБП.
Скачайте и распакуйте свежую прошивку в отдельную директорию
где as204501.ufi - имя первого файла прошивки (если файлов прошивки несколько) Соглашаемся (Yes) с тем, что будем прошивать и ждем завершения прошивки.
После завершения прошивки обязательно перегружаем сервер и через arcconf проверяем обновилась ли прошивка.
Отсутствие разделов массива
Для обеспечения нормальной работы RAID массивов применяется технология чередования, главной задачей которой является распределение информации меду дисками в рамках одного логического тома. Это позволяет обеспечить высокий уровень производительности и защиты данных, однако, если механизм чередования будет повреждён – данные окажутся недоступными, даже если физически они в полной сохранности. Все дело в том, что RAID массив просто не смоет определить диски с данными и соответственно не сможет собрать массив для дальнейшей работы.
Случилась авария
Для начала смотрим что драйвер контроллера нам скажет по поводу конфигурации массива, все ли сегменты массива в порядке, сколько их и прочую информацию.
Если все сегменты в порядке, то стоит визуально посмотреть как себя ведут винты в массиве. В одном случае один из винтов лихорадочно моргал, в то время как остальные винты практически спали. При все при этом, обратиться к разделу на этом массиве было практически невозможно – ls любой каталог раздела длился порядка 30-40 секунд. Значит что-то здесь не то.
Продолжим собирать информацию, прежде чем что-то делать – тут торопиться не надо.
Получим логи с контролера. Они не очень информативные, но надо посмоттреть.
Дату в логах можно перевести в удобоваримый вид к примеру так
Вместо 1234883784 вставьте свое значение
Вычисляем какой из сегментов (винтов) массива неисправен и пробуем сделать verify (в этом примере диск 0:21).
Посмотреть статус проверки можно так
Если с ним что-то не так, то проверка это покажет.
Начинаем лечить наш массив. Есть два метода.
Второй метод описывать не буду, т.к. он зависит от версии контроллера.
Вынуть сбойный диск (систему не останавливать, при чем еще раз оговорюсь, это если массив с избыточным резервированием, raid5-6), система продолжает работать в частично разрушенном состоянии. Это можно увидеть, если запросить конфиг контроллера еще раз.
Убеждаемся, что все хорошо – массив работает без нашего диска. Теперь стоит на его место вставить точно такой же, новый винт. Ставим. После чего запускаем рескан дисков, чтобы контроллер обнаружил новый диск и включил его в наш массив.
После сканирования дисков, массив должен обнаружить новый диск и включить ребилд нашего массива. Это состояние опять же стоит посмотреть
Если идет ребилд массива, значит все в порядке и по его завершению, мы получим новый винт в строю массива.
Создайте программный RAID с помощью командной строки
Другой способ создать программный RAID – использовать командную строку или Windows PowerShell.
Чтобы создать программный RAID с помощью командной строки:
-
Щелкните правой кнопкой мыши «Пуск» и выберите «Командная строка (Администратор)» или «Windows PowerShell (Admin)».
Чтобы отобразить список дисков, введите «list disk».
Утилита Diskpart отобразит все диски, подключенные к вашему ПК.
- select disk 1 – где 1 – номер желаемого диска
- convert dynamic – преобразовать в динамический
- select disk 2
- convert dynamic
- select disk 3
- convert dynamic
Теперь, когда мы преобразовали наши диски, мы можем создать том RAID, введя следующие команды:
- select disk 1
- Create Volume RAID Disk 1, 2, 3
После этого следует убедиться, что массив создан.
Для этого введите команду «list disk».
Все диски будут объединены в один диск.
- select volume 2
- Format FS=NTFS Label=MyNewVolume
- Assign Letter=F
После этого выбранные диски будут объединены в RAID-массив.
Отметим, что с помощью этого метода будет создан RAID 5.
Добавить диск в массив
Добавить новый диск в массив и расширить LUN до максимума на размер этого диска можно так
Это при условии, что на первом LUN который мы моифицируем, был raid5 и состоял он из шести сегментов (0,24 0,25 0,26 0,27 0,28 0,29), добавляем новый сегмент 0,30
Создаем новый LUN включая 6 сегментов, размер максимальный, raid5
Проверяем созданный LUN:
Проверяем – идет ли сборка массива?
Технические характеристики
Часто задаваемые вопросы
Деградированный режим значит, что один или несколько дисков массива вышли из строя, но массив еще работает. В такой ситуации настоятельно рекомендуется найти причину и заменить вышедшие из строя части.
ДА. Благодаря продвинутым алгоритмам RS RAID Retrieve без проблем перестроит ваш массив и восстановит информацию. Процесс восстановления детально расписан на нашем сайте.
Первым делом вам следует проверить состояние дисков массива, так как именно из-за выхода накопителей из строя наблюдается сильное снижение производительности.
Эта ошибка означает, что один диск не работает. Поэтому, при возникновении такой ошибки проверьте состояние массива и замените нерабочие детали, в противном случае вы можете потерять информацию
Среди главных причин выхода из строя массива RAID можно выделить такие как выход из строя RAID контроллера, выход из строя одного или нескольких дисков, поломки сервера/компьютера/NAS, отсутствие разделов массива и т.д. Более детально читайте на нашем сайте.
Каким бы мощным ни был ваш компьютер, у него все же есть одно слабое место: жесткий диск. Он отвечает за целостность и безопасность ваших данных и оказывает значительное влияние на производительность вашего ПК. При этом жесткий диск – единственное устройство в системном блоке, внутри которого есть движущиеся механические части, что и делает его слабым звеном, способным полностью вывести из строя ваш компьютер.
Сегодня есть два способа ускорить работу вашего компьютера: первый – купить дорогой SSD, а второй – по максимуму использовать материнскую плату, то есть настроить массив RAID 0 из двух жестких дисков. Тем более RAID-массив можно использовать и для повышения безопасности ваших важных данных.
В этой статье мы рассмотрим, как создать программный RAID с помощью встроенных инструментов Windows.
Как создать программный RAID при помощи функции «Дисковые пространства»
Windows 10 имеет встроенную функцию «Дисковые пространства», которая позволяет объединять жесткие диски или твердотельные накопители в один дисковый массив, называемый RAID. Эта функция была впервые представлена в Windows 8 и значительно улучшена в Windows 10, что упростило создание многодисковых массивов.
Чтобы создать массив RAID, вы можете использовать как функцию «Дисковые пространства», так и командную строку или «Windows PowerShell».
Перед созданием программного RAID необходимо определить его тип и для чего он будет использоваться. Сегодня Windows 10 поддерживает три типа программных массивов: RAID 0, RAID 1, RAID 5 (Windows Server).
Вы можете прочитать о том, какие типы RAID существуют и какой RAID в каких целях лучше использовать, в статье «Типы RAID и какой RAID лучше всего использовать».
Итак, мы определились с типом RAID. Затем для создания дискового массива мы подключаем все диски к компьютеру и загружаем операционную систему.
Стоит отметить, что все диски будущего RAID должны быть одинаковыми не только по объему памяти, но желательно и по всем другим параметрам. Это поможет избежать многих неприятностей в будущем.
Далее, чтобы создать программный RAID-массив, выполните следующие действия:
-
Откройте «Панель управления», щелкнув правой кнопкой мыши «Пуск» и выбрав «Панель управления» («Control Panel»).
Важно: все данные на дисках, из которых создается RAID-массив, будут удалены. Поэтому заранее сохраните все важные файлы на другой диск или внешний носитель.
После того, как вы настроили массив, вы должны дать ему имя и правильно настроить.
Именно с этим именем и буквой массив будет отображаться в системе Windows.
- Простой (без отказоустойчивости) – это RAID 0;
- Двустороннее зеркало — RAID 1;
- Трехстороннее зеркало – это тоже RAID 1 (с разницей только в количестве копий основного жесткого диска);
- Четность – RAID 5.
В зависимости от выбранного типа RAID мастер автоматически установит максимально доступную емкость дискового массива.
Обычно это значение немного ниже, чем фактический объем доступных данных, и вы также можете установить больший размер дискового пространства. Однако имейте в виду, что это сделано для того, чтобы вы могли установить дополнительные жесткие диски, когда массив будет заполнен, без необходимости перестраивать его.
После того, как мастер настроит ваш новый RAID, он будет доступен как отдельный диск в окне «Этот компьютер».
Новый диск не будет отличаться от обычного жесткого диска, и вы можете выполнять с ним любые операции, даже зашифровать его с помощью BitLocker.
Об использовании BitLocker вы можете прочитать в статье «Как зашифровать данные на жестком диске с помощью BitLocker».
Вы можете создать еще один программный RAID. Только количество жестких дисков, подключенных к ПК, ограничивает количество создаваемых RAID-массивов.
Программное создание RAID в Windows 7
В Windows 7 вы можете использовать утилиту «Управление дисками» для создания программного RAID. Следует отметить, что диск, с которого загружается система, нельзя использовать в RAID, так как он будет преобразован в динамический. Вы можете использовать любые диски, кроме системных.
Шаг 1. Откройте «Пуск», щелкните правой кнопкой мыши «Компьютер» и выберите «Управление».
Шаг 2: В появившемся мастере нажмите «Далее».
Шаг 3. В открывшемся меню вы должны выбрать диски, которые вы хотите объединить в массив RAID, и нажать «Далее».
Шаг 4: Выберите букву для созданного RAID-массива и нажмите «Далее».
- S (Striping) — соответствует RAID 0;
- M (Mirroring) — соответствует RAID 1;
Шаг 5: В следующем окне выберите тип файловой системы (NTFS), укажите размер блока и укажите имя тома. После этого нажмите «Далее».
Шаг 6: После того, как система создаст новый массив RAID, нажмите кнопку «Готово».
После нажатия кнопки «Готово» появится окно с предупреждением о том, что будет выполнено преобразование базового диска в динамический и загрузка ОС с динамического диска будет невозможна. Просто нажмите «ОК».
После этого созданный RAID-массив отобразится в окне «Мой компьютер» как обычный жесткий диск, с которым можно выполнять любые операции.
Иногда при добавлении диска в RAID массив может появляться ошибка «Can’t Add new drive, error 0x00000032». В некоторых случаях эта ошибка появляется при создании RAID массива. Причем, ошибка 0x00000032 может появится даже после того, как вы очистили и отформатировали ваш накопитель. Обычно она возникает на дисках, которые уже использовались в RAID массиве или в операционной системе.
В некоторых случаях RAID массив может сообщать о поломке диска, хотя на самом деле с ним все в порядке. Чтобы решить этот вопрос нужно сначала понять причину возникновения ошибки.
Причиной возникновения ошибки «Can’t Add new drive, error 0x00000032» являются неправильные метаданные, которые остаются на диске даже после очистки и форматирования накопителя. Кроме того, часто причиной ошибки являются данные в загрузочном секторе, которые форматирование и очистка диска не удалили.
Все дело в том, что очистка диска и форматирование не очищают диск физически, а только удаляют все «ссылки на файлы», и указывают операционной системе, что она может записывать информацию в новый раздел, стирая предыдущие данные.
Однако, физически файлы (в том числе и метаданные) остаются на диске и при добавлении диска в RAID массив вызывают ошибки.
Для этого следует:
Шаг 1: Щелкните правой кнопкой мыши по «Пуск» и выберите «Windows PowerShell (Администратор)»
Шаг 2: В открывшемся окне введите команду:
…и нажмите «Enter» для ее выполнения.
Шаг 3: Перед вами откроется список ваших дисков, в котором будет указано имя каждого диска (колонка FriendlyName) и его уникальный идентификатор (колонка UniqueID).
Выделите UniqueID нужного диска и скопируйте его при помощи комбинации клавиш «Ctrl + C»
Примечание: вы также можете использовать имя диска (FriendlyName), однако в некоторых случаях система можете отображать одинаковое имя для всех дисков. Поэтому для избегания ошибок лучше всего использовать UniqueID диска.
Шаг 4: Чтобы сбросить ваш диск используйте следующую команду:
…заменив your-unique-id на идентификатор диска, который вы скопировали ранее (чтобы вставить идентификатор используйте комбинацию клавиш «Ctrl +V»). В результате ваша команда должна выглядеть примерно, как на скриншоте ниже.
Важно: уникальный идентификатор вашего диска должен находится в двойных кавычках. Иначе команда не будет работать.
После этого вы снова можете использовать этот диск в вашем RAID–массиве.
Что такое деградированный режим RAID?
Также о переходе массива в деградированный режим может свидетельствовать символ «[U_]» при проверке состояния RAID массива в терминале. Обычно он находится возле поврежденного диска и означает, что он рассинхронизирован.
В этом случае следует немедленно заменить поврежденный диск так как в случае выхода из строя еще одного диска все данные массива будут потеряны.
Температура
Вначале хотелось бы затронуть такую важную вещь, как температурный режим аппаратных RAID-контроллеров Adaptec. Все они оснащены небольшими пассивными радиаторами, что может вызвать ложное представление о небольшом тепловыделении.
Производитель контроллера приводит в качестве рекомендуемого значения воздушного потока — 200 LFM (linear feet per minute), что соответствует показателю 8,24 литра в секунду (или 1,02 метра в секунду). Рассчитаны такие контроллеры исключительно на установку в rackmount-корпусы, где такой воздушный поток создается скоростными штатными кулерами.
От 0°C до 40-55°C — рабочая температура большинства RAID-контроллеров Adaptec (в зависимости от наличия установленных модулей), рекомендованная производителем. Максимальная рабочая температура чипа составляет 100°C. Функционирование контроллера при повышенной температуре (более 85°C) может вывести его из строя. Удобства ради приводим под спойлером табличку рекомендуемых температур для разных серий контроллеров Adaptec.
Series 2 (2405, 2045, 2805) and 2405Q | 55°C без модулей |
Series 5 (5405, 5445, 5085, 5805, 51245, 51645, 52445) | 55°C без батарейного модуля, 40°C с батарейным модулем ABM-800 |
Series 5Z (5405Z, 5445Z, 5805Z, 5805ZQ) | 50°C с модулем ZMCP |
Series 5Q (5805Q) | 55°C без батарейного модуля, 40°C с батарейным модулем ABM-800 |
Series 6E (6405E, 6805E) | 55°C без модулей |
Series 6/6T (6405, 6445, 6805, 6405T, 6805T) | 55°C без ZMCP модуля, 50°C с ZMCP модулем AFM-600 |
Series 6Q (6805Q, 6805TQ) | 50°C с ZMCP модулем AFM-600 |
Series 7E (71605E) | 55°C без модулей |
Series 7 (7805, 71605, 71685, 78165, 72405) | 55°C без ZMCP модуля, 50°C с ZMCP модулем AFM-700 |
Series 7Q (7805Q, 71605Q) | 50°C с ZMCP модулем AFM-700 |
Series 8E (8405E, 8805E) | 55°C без модулей |
Series 8 (8405, 8805, 8885) | 55°C без ZMCP модуля, 50°C с ZMCP модулем AFM-700 |
Series 8Q (8885Q, 81605Z, 81605ZQ) | 50°C с ZMCP модулем AFM-700 |
Нашим клиентам не приходится беспокоиться о перегреве контроллеров, поскольку в наших дата-центрах поддерживается постоянный температурный режим, а сборка серверов произвольной конфигурации происходит с учетом особенностей таких комплектующих (о чем мы упоминали в нашей предыдущей статье).
Настройка мониторинга
Вопрос мониторинга статуса работы оборудования и возможности оповещения стоит достаточно остро для любого системного администратора. Для того чтобы настроить «связку» из Zabbix и RAID-контроллера Adaptec рекомендуем воспользоваться перечисленными решениями.
Зачастую требуется отслеживать состояние контроллера напрямую из гипервизора, например, VMware ESXi. Задача решается с помощью установки CIM-провайдера с помощью инструкции Microsemi.
Что делать при сбое RAID массива или если RAID массив не собирается после перезагрузки?
Если ваш RAID массив перестал работать после сбоя, либо не собирается после перезагрузки то для восстановления рабочего состояния без потери данных вам следует сначала извлечь данные массива, чтобы не повредить их во время восстановления работоспособности RAID. Для этого следует:
Шаг 1: Выключите питание вашего компьютера/сервера или NAS устройства и отсоедините накопители, из которых состоял RAID массив.
Шаг 2: Подсоедините эти диски в рабочему компьютеру (предварительно отключив его питание).
Шаг 3: Включите рабочий компьютер. Затем скачайте и установите програму RS RAID Retrieve следуя подсказкам мастера установки Windows.
Мы специально выбрали эту программу, так как она обладает широкими возможностями восстановления данных и интуитивно-понятным интерфейсом одновременно, а значит она отлично подходит как для неопытных пользователей, так и для профессионалов.
Шаг 4: Запустите программу RS RAID Retrieve дважды кликнув по иконке на рабочем столе. Перед вами откроется встроенный RAID конструктор.
Шаг 5: Выберите тип добавления RAID массива для сканирования. RS RAID Retrieve предлагает на выбор три варианта:
- Автоматический режим – позволяет просто указать диски, из которых состоял массив, и программа автоматически определит их порядок, тип массива и остальные параметры;
- Поиск по производителю – эту опцию следует выбрать, если вам известен производитель вашего RAID контроллера. Эта опция также автоматическая и не требует каких-либо знаний о структуре RAID массива. Наличие данных о производителе позволяют сократить время на построение массива, соответственно она быстрее предыдущей;
- Создание вручную – эту опцию стоит использовать если вы знаете какой тип RAID массива вы используете. В этом случае вы можете указать все параметры, которые вам известны, а те, которых вы не знаете – программа определит автоматически.
После того, как выберите подходящий вариант – нажмите «Далее»
Шаг 6: Выберите диски, из которых состоял RAID массив и нажмите «Далее». После этого начнется процесс обнаружения конфигураций массива. После его завершения нажмите «Готово»
Шаг 7: В окне программы выберите ваш массив, щелкните по нему правой кнопкой мыши и выберите «Сохранить диск», а затем укажите место для сохранения копии диска и снова нажмите «Сохранить»
После этого начнется копирование файлов в указанное место. Вы также можете сохранить отдельные файлы или восстановить потерянные данные, если нужно. Для этого дважды щелкните на массиве и выберите тип сканирования. RS RAID Retrieve предлагает на выбор два типа сканирования: быстрое сканирование и полное сканирование. Первый вариант стоит выбрать если вы просто хотите скопировать файлы на другой носитель, а второй вариант выберите если хотите восстановить утерянные данные.
Также на этом этапе выберите тип файловой системы вашего массива. RS RAID Retrieve поддерживает ВСЕ современные файловые системы. Теперь, когда все настроено, нажмите «Далее».
Начнётся процесс сканирования массива, по завершении которого вы увидите прежнюю структуру файлов и папок.
Шаг 8: Выберите файл, который хотите восстановить и жажды на нем щелкните. Затем выберите место, куда хотите восстановить утерянный файл. Это может быть жесткий диск, ZIP-архив, или FTP-сервер. Главное, чтобы место записи нового файлов отличалось от дисков массива. Затем нажмите «Восстановить»
Теперь, когда данные находятся в безопасности – можно приступать к восстановлению работоспособности самого массива. В первую очередь нужно найти причину проблемы и устранить ее.
RAID массив мажет не пересобираться после перезагрузки по следующим причинам:
- Ошибка в файле mdadm.conf (он находится не в том месте, или файл не существует);
- Ошибка сборки;
- Вирус или вредоносное ПО;
- Поврежденные сектора на RAID-дисках;
- Человеческая ошибка;
- Другие причины;
Первые две причины являются достаточно распространенными, поэтому на них стоит обратить особое внимание.
Если же причина или сбой были на физическом уровне – замените вышедшие из строя нужные элементы.
Если вы не хотите тратить время на исправление программных ошибок – вы можете просто создать RAID массив заново, а затем скопировать данные обратно из сохраненной копии.
Поломка сервера
Хост компьютер, как и любой другой может поломаться или дать сбой. Это в свою очередь отобразится на RAID массиве. В 70% таких случаев данные оказываются недоступными.
Все вышеперечисленные поломки являются наиболее часто встречающимися причинами выхода из строя RAID массивов. Обычно, после таких поломок приходится использовать стороннее ПО для восстановления данных. О том, как восстановить данные на RAID массиве читайте в следующем пункте этой статьи.
Выход накопителя из строя
Все мы знаем, что главным предназначением RAID массивов является защита данных на случай выхода из строя одного или двух дисков. Обычно RAID массив без проблем справляется с этой задачей. Но иногда случаются ситуации, когда при выходе одного или нескольких дисков повреждаются данные на соседнем носителе и в такой ситуации RAID массив может оказаться полностью неработоспособным, что в свою очередь приведет к потере информации. Поэтому настоятельно рекомендуется периодически проверять состояние накопителей, из которых построен RAID массив.
С аппаратным RAID
Прежде чем сервер сможет использовать единое дисковое пространство RAID-массива, необходимо выполнить базовую настройку контроллера и логических дисков. Сделать это можно двумя способами:
- при помощи внутренней утилиты контроллера,
- утилитой из операционной системы.
Утилита позволяет не только управлять настройками контроллера, но и логическими устройствами. Инициализируем физические диски (вся информация на дисках при инициализации будет уничтожена) и создадим массив RAID-10 с помощью раздела Create Array. При создании система запросит желаемый размер страйпа, то есть размер блока данных за одну I/O-операцию:
- больший размер страйпа идеален для работы с файлами большого размера;
- меньший размер страйпа подойдет для обработки большого количества файлов небольшого размера.
Важно — размер страйпа задается только один раз (при создании массива) и это значение в дальнейшем изменить нельзя.
Сразу после того, как контроллеру отдана команда создания массива, также, как и с программным RAID, начинается процесс перестроения данных на дисках. Этот процесс работает в фоновом режиме, при этом логический диск становится сразу доступен для BIOS. Производительность дисковой подсистемы будет также снижена до завершения процесса. В случае, если было создано несколько массивов, то необходимо определить загрузочный массив с помощью сочетания клавиш Ctrl + B.
После того как статус массива изменился на Optimal, мы установили Bitrix24 и провели точно такой же тест. Результат теста:
Сразу становится понятно, что аппаратный RAID-контроллер ускоряет операции чтения и записи на дисковый носитель за счет использования кэша, что позволяет быстрее обрабатывать массовые обращения пользователей.
RAID 0
Если вы хотите создать RAID 0, в утилите Diskpart введите:
- list disk;
- create volume stripe size=n disk=1,2,3 – где n — размер в мегабайтах, а 1,2,3 — номера дисков, которые будут включены в массив RAID 0.
Причины потери данных на RAID массивах
При использовании RAID массивов данные хранятся на таких же накопителях, что и в обычных компьютерах, которые могут ломаться и т.д. Технология RAID позволяет предотвратить потерю данных, но процесс восстановления информации может сильно затянуться, так как нередко при выходе из строя одного накопителя скорость работы всего RAID массива сильно снижается, особенно это актуально, когда речь заходит о терабайтах информации, как например на сервере. Кроме того, в некоторых случаях, чтобы заменить поврежденный носитель на новый – требуется отключение питания, что тоже не очень подходит для серверов. Поэтому лучше всего знать главные причины выхода из строя RAID массивов, чтобы иметь возможность предотвратить неприятности.
Итак, среди основных причин можно выделить следующие:
С программным RAID
Несомненное преимущество программного RAID — простота использования. Массив в ОС Linux создается с помощью штатной утилиты mdadm. При установке операционной системы чаще всего создание массива предусмотрено непосредственно из установщика. В случае, когда такой возможности установщик не предоставляет, достаточно всего лишь перейти в соседнюю консоль с помощью сочетания клавиш Ctrl+Alt+F2 (где номер функциональной клавиши — это номер вызываемой tty).
Создать массив очень просто. Командой fdisk -l смотрим, какие диски присутствуют в системе. В нашем случае это 4 диска:
Проверяем, чтобы на дисках не было метаданных, например, от предыдущего массива:
В случае, если на одном или нескольких дисках будут метаданные, удалить их можно следующим образом (где sdX — требуемый диск):
Создадим на каждом диске разделы для будущего массива c помощью fdisk. В качестве типа раздела следует указать fd (Linux RAID autodetect).
Собираем массив RAID 10 из созданных разделов с помощью команды:
Сразу после этого будет создан массив /dev/md0 и будет запущен процесс перестроения данных на дисках. Для отслеживания текущего статуса процесса введите:
Пока процесс перестроения данных не будет завершен, скорость работы дискового массива будет снижена.
После установки операционной системы и Bitrix24 на созданный массив мы запустили стандартный тест и получили следующие результаты:
Как добавить или удалить диск в уже существующем массиве RAID
Внешний вид
Мы выбрали решения Adaptec от компании Microsemi. Это RAID-контроллеры, зарекомендовавшие себя удобством использования и высокой производительностью. Их мы устанавливаем, если наш клиент решил заказать сервер произвольной или фиксированной конфигурации.
Для подключения дисков используются специальные интерфейсные кабели. Со стороны контроллера используются разъемы SFF8643. Каждый кабель позволяет подключить до 4-х дисков SAS или SATA (в зависимости от модели). Помимо этого интерфейсный кабель еще имеет восьмипиновый разъем SFF-8485 для шины SGPIO, о назначении которой поговорим чуть позже.
Помимо самого RAID-контроллера существует еще два дополнительных устройства, позволяющих увеличить надежность:
-
BBU (Battery Backup Unit) — модуль расширения с литий-ионной батареей, позволяющий поддерживать напряжение на энергозависимой микросхеме кэша. В случае внезапного обесточивания сервера его использование позволяет временно сохранить содержимое кэша, которое еще не было записано на диски.
Это особенно важно, когда включен режим отложенной записи кэша (Writeback). При пропадании электропитания содержимое кэша не будет сброшено на диски, что приведет к потере данных и, как следствие, штатная работа дискового массива будет нарушена.
Замена диска
Замена диска производится в случае неисправности, но я просто поменяю диск.
Выберем диск для замены: В случае неисправности состояние диска будет отличаться от других.
Неисправный диск автоматически выведен из работы, его можно просто вынуть, но мой диск исправен.
Пометим диск как сбойный
Проверим - изменилось ли стсотояние диска? Проверим статус:
Теперь диск можно вынуть и вставить другой. Действия после этого как в случае с аварией. Примечание: - утилита arcconf имеет массу дополнительных параметров, читайте руководство.
Подключить диск Hot spare
Подключить диск 0:11 как hot spare к трем лунам 1-2-3
Настройка кэширования
Теперь пару слов о вариантах работы кэша на запись. Вариант Write Through означает, что контроллер сообщает операционной системе об успешном выполнении операции записи только после того, как данные будут фактически записаны на диски. Это повышает надежность сохранности данных, но никак не увеличивает производительность.
Чтобы достичь максимальной скорости работы, необходимо использовать вариант Write Back. При такой схеме работы контроллер будет сообщать операционной системе об успешной IO-операции сразу после того, как данные поступят в кэш.
Важно — при использовании Write Back настоятельно рекомендуется использовать BBU или ZMCP-модуль, поскольку без него при внезапном отключении электричества часть данных может быть утеряна.
Создание программного RAID с помощью встроенных инструментов Windows 8 или Windows 10
Как создать программный RAID при помощи функции «Управление дисками»
Еще одним способом создания программных RAID массивов в операционной системе Windows является использование встроенной утилиты под названием «Управление дисками». Она позволяет создавать все базовые типы RAID. Также, как и предыдущий, этот способ достаточно легкий и не требует глубоких знаний операционной системы. Итак, чтобы создать программный RAID 0 следует:
Шаг 1: Щелкните правой кнопкой мыши по «Пуск» и выберите «Управление дисками»
Шаг 2: Перед вами откроется «Управление дисками», в котором будут отображаться все подключенные диски. Щелкните правой кнопкой мышки и выберите «Создать чередующийся том»
Шаг 3: Откроется «Мастер создания чередующихся томов». Щелкните «Далее», затем выделите в левой части окна мастера диски, которые хотите добавить в массив RAID 0 и нажмите «Добавить». Когда все нужные диски будут добавлены нажмите «Далее»
Шаг 4: Назначьте букву массива, выбрав нужную из списка (буква устанавливается автоматически, так что вы можете оставить все так, как предлагает мастер создания массива) и снова нажмите «Далее»
Шаг 5: На этом этапе нужно выбрать файловую систему будущего массива. Выберите «NTFS» и снова нажмите «Далее»
Шаг 6: На этом этапе нажмите кнопку «Готово». Система покажет предупреждение, что выбранные диски будут конвертированы в динамические и что вся информация на них будет уничтожена. Нажмите «Да»
Начнется форматирование и синхронизация дисков, после чего наш массив RAID 0 будет создан.
Массив RAID 1 создается аналогичным образом, только на первом шаге вместо «Чередования» выберите «Зеркалирование».
Все остальные шаги выглядят аналогично.
Содержание:
Современные материнские платы позволяют создавать дисковые RAID-массивы без необходимости докупать оборудование. Это позволяет значительно сэкономить на сборке массива в целях повышения безопасности данных или ускорения работы компьютера.
Как удалить диск из RAID-массива
Чтобы удалить диск из RAID-массива, следуйте алгоритму:
- Откройте утилиту «Дисковые пространства», как описано выше, и нажмите кнопку «Изменить параметры».
- Откройте существующий массив RAID и выберите «Физические диски».
- Во всплывающем списке выберите диск, который вы хотите удалить, и нажмите «Подготовить к удалению».
Windows автоматически перенесет данные на другие диски, а кнопка «Подготовить к удалению» изменится на «Удалить».
После нажатия кнопки «Удалить» система удалит диск из RAID. Для дальнейшей работы с этим накопителем вам потребуется создать на нем новый раздел. Для этого вы можете использовать встроенную утилиту diskpart или утилиту Disk Management.
Заключение
Использование аппаратного RAID-контроллера оправдано в большинстве случаев, когда требуется высокая скорость и надежность работы дисковой подсистемы.
Системные инженеры Selectel бесплатно выполнят базовую настройку дискового массива на аппаратном RAID-контроллере при заказе сервера произвольной конфигурации. В случае, если потребуется дополнительная помощь с настройкой, мы будем рады помочь в рамках нашей услуги администрирования. Также мы подготовили для наших читателей небольшую памятку по командам утилиты arcconf.
Имеется 8 дисков Seagate ST3500320AS и Adaptec 3805
на контроллере стоит последняя доступная с сайта адаптека прошивка build 17342
На дисках кроме RAID5EE есть еще один RAID5 и два массива RAID6,
кроме этого в начале дисков когда-то был RAID0 на 30Gb
и на 3-х дисках (CN1 D0,1,3)в начале осталась маленькая, едва заметная ступенька из пустоты.
После того, как один диск в начале февраля внезапно умер,
на заново установленном диске контроллер неправильно выделил области под массивы.
(дальняя область на всех остальных дисках, относящаяся к RAID5EE восстановилась как первая в начале,
причем сделано это было контроллером довольно жестоко, экспандинг 5EE массива был сделан
поверх только что прошедших ребилд сегментов остальных массивов,
т.е. фактически он "убил" только что восстановленные сегменты
других массивов,что привело к повторному их ребилду в конце диска)
Поочередно: помечал диск как failed, отключал диск, подключал обратно - ждал полного восстановления,
потом то же самое со следующим диском.
Первые три диска (СN0 D0,1,2)нормально восстановились, ступенька от RAID0 в начале убралась.
Затем дошла очередь до диска(CN0 D3), на котором массивы ранее были восстановлены немного не так.
Действия такие же: пометка как failed, отключение, подключение обратно.
RAID5EE как и полагается перешел в статус "Compacting",
Сбой произошел после того, как я вернул диск обратно, RAID5EE почти сразу получил статус оффлайн (минут через 15 после начала компактинга).
Подключенный диск не определялся, rescan bus не помогал, появился обратно только после рестарта системы.
Все остальные массивы восстанавились нормально по старым местам.
Но в реализации этого варианта меня пугает другое -
контроллер не дает мне сейчас создавать новые массивы,
при выборе любого диска для нового массива пишет,
что Physical drive segment limit reached.
Первый раз я на это наткнулся, когда ранее я не смог пересоздать RAID0. Но так как он был ненужен, то разбираться не стал.
А сейчас удалил самый дальный массив RAID5, в итоге получилось минус два массива, есть много свободного места,
а новый массив создать все равно не дает!
Что это? Косяк прошивки?
Или количество поддерживаемых массивов уменьшилось на значительную величину в новых прошивках?
(массивы создавались при другой прошивке три года назад)
Или просто нельзя создать логическое устройство номер 1, если уже есть номер 5?
Удаленные ранее массивы имели логические номера 1 и 4.
т.е. сейчас присуствуют логические устройства номер 0, 2, 3, 5.
0: RAID5 100Gb
2: RAID6 500Gb
3: RAID6 513Gb
5: RAID5EE 1242Gb
Для примера список сегментов CN0 D0.
Пока я пришел к выводу, что у меня фактически сейчас два варианта:
1. Удалить массив и если контроллер все-таки дает создать новый, то действую дальше, если не дает что делать тогда вообще непонятно.
Можно было попробовать удалить и другие массивы, но тогда я уже скорее всего не смогу создать новый RAID5EE
в тех же границах, что и старый из-за смещения по разным дискам.
2. Попробовать создать виртуальный RAID5 в R-Studio, но поймет ли она RAID5EE из 7 дисков я не знаю.
В современном мире все уже давно поняли какой ценностью обладает информация и какой огромный потенциал заложен в развитии IT технологий. Поскольку сервера и компьютеры могут выходить из строя – автоматически возник вопрос как обеспечить безопасность данных, так как их потеря важной информации может обанкротить целые компании, а убытки могут достигать многих миллионов. В свою очередь это привело в появлению RAID массивов – технологии, которая призвана предотвратить потерю информации путем объединения нескольких накопителей в один массив. Однако, как показала практика – RAID массивы также могут ломаться.
В этой статье мы рассмотрим главные причины выхода из строя RAID массивов.
Управление контроллером
Непосредственно из операционной системы управление контроллером производится с помощью программного обеспечения, доступного для скачивания с сайта производителя. Доступны варианты для большинства операционных систем и гипервизоров:
- Debian,
- Ubuntu,
- Red Hat Linux,
- Fedora,
- SuSE Linux,
- FreeBSD,
- Solaris,
- Microsoft Windows,
- Citrix XenServer,
- VMware ESXi.
С помощью указанных утилит можно, не прерывая работу сервера, легко управлять логическими и физическими дисками. Также можно задействовать такой полезный функционал, как «подсветка диска». Мы уже упоминали про пятый кабель для подключения SGPIO — этот кабель подключается напрямую в бэкплейн (от англ. backplane — соединительная плата для накопителей сервера) и позволяет RAID-контроллеру полностью управлять световой индикацей каждого диска.
Следует помнить, что бэкплэйны поддерживают не только SGPIO, но и I2C. Переключение между этими режимами осуществляется чаще всего с помощью джамперов на самом бэкплэйне.
Каждому устройству, подключенному к аппаратному RAID-контроллеру Adaptec, присваивается идентификатор, состоящий из номера канала и номера физического диска. Номера каналов соответствуют номерам портов на контроллере.
Замена диска — штатная операция, впрочем, требующая однозначной идентификации. Если допустить ошибку при этой операции, можно потерять данные и прервать работу сервера. С аппаратным RAID-контроллером такая ошибка является редкостью.
Делается это очень просто:
-
Запрашивается список подключенных дисков к контроллеру:
Например, на платформах Supermicro штатная работа диска — зеленый или синий цвет, а «подсвеченный» диск будет моргать красным. Перепутать диски в этом случае невозможно, что позволит избежать ошибки из-за человеческого фактора.
Прочие проблемы
Иногда можно попасть в ситуацию когда при таймауте контроллера файловая система переходит в режим только чтение и использование arcconf становится невозможным.
Причина в том, что утилита не может создать в файловой системе лок-файл для своей работы.
Решение простое - смонтировать туда tmpfs:
После этого утилита должна заработать.
Следует заметить, что нужно быть максимально аккуратным и внимательным при работе с массивами и особенно с их ремонтом. Не торопитесь и думайте , что делаете до полного понимания.
Как добавить диск в RAID
Предположим, у вас уже есть программный RAID-массив, и вы его используете. Однажды может возникнуть ситуация, когда вам станет не хватать места на диске. К счастью, Windows 10 позволяет добавить еще один диск в уже существующий массив с помощью встроенных инструментов.
Чтобы добавить диск, вы должны открыть утилиту «Дисковые пространства», используя метод, описанный выше, и выбрать «Добавить диски».
В открывшемся меню выберите диск, который хотите добавить, и нажмите «Добавить диск». Жесткий диск будет добавлен к уже существующему массиву RAID.
Содержание:
Выход из строя RAID контроллера
Контроллер RAID массива является одним из наиболее важных элементов, так как именно он отвечает за распределение данных между накопителями и позволяет работать с массивом как с единым накопителем. Если массив прекращает свою работу – наиболее часто это вызвано именно поломкой контроллера. Стоит отметить, что аппаратные контроллеры ломаются немного реже чем программные, но и стоят они на порядок дороже. Кроме того, между аппаратными контроллерами разных производителей нет совместимости. То есть, если вы приобрели контроллер от фирмы Supermicro то для восстановления работоспособности массива вам придется купить такую же модель. В противном случае вам придется создавать массив заново, что приведет к потере данных. Среди причин, из-за которых контроллер выходит и строя можно выделить такие как перепад напряжения или резкое отключение энергии. Это актуально как для аппаратных RAID контроллеров, так и для программных. Поэтому, обязательно позаботьтесь о бесперебойном источнике питания, чтобы обеспечить ваш RAID массив от возможных проблем.
Скорость работы
Для того чтобы продемонстрировать, как наличие аппаратного RAID-контроллера способствует увеличению скорости работы сервера, мы решили собрать тестовый стенд со следующей конфигурацией:
- CPU Intel Xeon E3-1230v5;
- RAM 16 Gb DDR4 2133 ECC;
- 4 HDD емкостью по 1 ТБ.
Затем в этот же стенд поставим RAID-контроллер Adaptec ASR 7805 с модулем защиты кэша AFM-700, подключим к нему эти же жесткие диски и выполним точно такое же тестирование.
Прошивка
Необходимость прошивки RAID-контроллера возникает чаще всего для исправления выявленных производителем проблем с работой устройства. Несмотря на то, что прошивки доступны для самостоятельного обновления, к этой операции следует подойти очень ответственно, особенно если процедура выполняется на «боевой» системе.
Если нашему клиенту требуется сменить версию прошивки контроллера, то ему достаточно создать тикет в нашей панели управления. Системные инженеры выполнят перепрошивку RAID-контроллера до требуемой версии в указанное время и сделают это максимально корректно.
Важно — не следует выполнять перепрошивку самостоятельно, поскольку любая ошибка может привести к потере данных!
Ошибка пересборки/сборки RAID массива
Во время каждой перезагрузки компьютера RAID массив пересобирается заново и от того, пройдет ли сборка нормально зависит дальнейшая работа массива. Если во время перестройки массива произойдёт перепад напряжения или другое форс-мажорное событие – массив не будет пересобран, и пользователь моет потерять данные.
Что делать, если вы потеряли важные данные на RAID-массиве
Использование RAID-массивов может значительно повысить безопасность данных, что очень важно в современном мире. Однако нельзя исключать человеческий фактор.
Потеря важных файлов возможна из-за случайного удаления, форматирования, изменения логической структуры файловой системы и многих других причин. Кроме того, не исключен сбой RAID.
В этой ситуации лучше не принимать поспешных решений. Оптимальный вариант — обратиться к специалистам или воспользоваться специализированным ПО для восстановления данных.
RS RAID Retrieve способен восстановить любой тип RAID-массива, поддерживает все файловые системы, используемые в современных операционных системах.
Команда для получения полной информации о контроллере:
если при запуске утилиты появится ошибка вида:
Нужно установить пакет libstdc++-v3 (для centos - compat-libstdc++-33) или указать где находится искомая библиотека, например так:
Самой важной информацией является информация о состоянии логических дисков
Ключевой информацией является строка
Просмотреть состояние дисков:
arcconf GETCONFIG 1 PD
Создание JBOD диска
Читайте также: