Megaraid bios config utility восстановление
Есть мать Supermicro X10DRi-T в нее воткнут LSI Megaraid 9341-8i
В режиме загрузки BIOS legacy - управление через внутр.софт на контроллере
В режиме UEFI через BIOS материнской платы. (Активировать появления дополнительного меню в БИОСЕ получилось только выставив PCI Express, на котором контроллер, в режим UEFI)
Будет 6 дисков SAS 900 Gb с поддержкой 4к. Пока в наличии 2. Подключаются через объединительную панель Supermicro
На 2х дисков с легкостью и непринужденностью создается и рейд 1 и 2. Но при установки Windows выдается ошибка, что установка на выбранный диск не возможна, возможно он не поддерживает загрузку. Тесты были на Win Server 2016 и Win Seven
Начал копать. Кнопка Boot Device не активна, при работе же через биос мат.платы при попытке выбрать значение boot device, в настройках контроллера,показывает пустоту, типа нечего выбирать. Так же за все это время ни рейд ни один хард не всплыл в настройках последовательности загрузки устройств. Вообщем мозг кипит :) Это мой первый LSI. Подскажите в какую сторону копать.
p.s подключал старый sata хард напрямую на мать. Все ок, все ставится.
- Вопрос задан более трёх лет назад
- 9062 просмотра
Проблему удалось решить
1. Сбросил BIOS’ы на default и обновил прошивки еще раз. Т.е. сделал стартовую чистую среду по дефолту
2. Сделал загрузчик UEFIсредствами RUFUS (можно и Diskpart’ом, но дольше и геморойнее). Так же обязательно выставить файловую систему NTFS
3. В BIOS мат.платы выставил слот PCIe в который воткнут контроллер в режим UEFI
4. В BIOS мат.платы выставил, загрузку UEFI или UEFI & Legacy
5. В BIOS мат.платы выставил первым загрузку BIOS UEFI Shell
6. Save and Reboot
Начал юзать UEFI когда не получилось ничего локальной конф.утилитой. Ну не активна кнопка бутдевайс и все. Хоть в ногу стреляйся:)
После создания Рейда и определения дисков в нем, надо проводить какие то дополнительные действия? инициализацию или еще что? Я не вижу никаких доп.параметров в утилите по назначению конкретного рейда бутом. Может потому что он один у меня.
LostLuser: а у вас старый контроллер совсем или вы просто не обновили биос на нем? Я просто помню версии биоса то там повыше.
Насколько помню в lsi можно и с одним рейдом сделать бут девайс, попробуйте создать два
если рейд зеркало то он должен пройти сборку сначала вроде и потом уже будет доступен для работы.
Пума Тайланд: Да вроде не очень старый. Даже я бы сказал из простых свежих. 12Gb/s и все такое. Просто наверное "бюджетный". БИОС обновил практически разу как столкнулся с этой проблемой. Спасибо за участие и потраченное время:) Буду дальше ковырять:)
p.s. два не могу создать:) не все диски еще пришли. пока только 2 в наличии
Список инструментов управления для LSI/Avago
Правильно подобранная утилита, может выполнять поставленную задачу в разы удобнее и быстрее, и знание всех инструментов является прямой обязанностью любого системного администратора.
Кстати я уже делал похожие подборки по инструментам управления и настройки для серверов IBM, Supermicro и HP
Утилита LSI Storage Authority
Про LSA (LSI Storage Authority) я уже делал подробнейший обзор. На текущий момент, это флагманский инструмент имеющий графический интерфейс управления, прямо из вашего браузера, что делает его кросплатфомным, убирающим привязку к операционной системе. Что хорошо, что утилита работает не на медленном Java, а на HTML5, что делает ее очень удобной.
Вот так выглядит общий дашборд управления, на нем вы увидите список ваших устройств представленных на сервере, в моем примере Controller ID: 0 LSI MegaRAID SAS 9280-16i4e.
Вот так выглядит информация по вашим виртуальным и физическим дискам. Хочу отметить, что LSI Storage Authority показывает больше информации по свойствам физических дисков, тут вы легко обнаружите:
- Status - Online
- Exposed As - PHYSICAL-DEVICE
- Product ID - THNSF8480CCSE
- Vendor ID - ATA
- Serial Number - Y7PS10C2TBJT
- Shield Counter - 0
- Device ID - 64
- Usable Capacity - 446.62GB Capacity - 447.13GB
- less properties - General Properties
- SAS Address 0 - 0x500062b200185da2
- Negotiated Link Speed - 6G
- Drive Speed - 6G
- Temperature - 25C
- Revision Level - DAC9
- Power Status - On
- Native Command Queueing Capable - No
- Physical Sector Size - 512B
- SCSI UNMAP - Disabled
- Enclosure Properties
- Enclosure ID - 245
- Enclosure Model - Backplane
- Enclosure Location - Internal
- Enclosure Connector - N/A
- Drive Security Properties
- Full Disk Encryption Capable - No
- Full Disk Encryption Type - NONE
- Protection Information Properties
- Protection Information - Incapable
Утилита MegaRAID Storage Manager
MegaRAID Storage Manager - это более старая утилита, с которой мы уже много взаимодействовали в предыдущих статьях. Например мы устанавливали MegaRAID Storage Manager на ESXI 5.5. Вот так выглядит базовый дашборд со сводной информацией, о RAID контроллерах LSI/Avago. Тут вы увидите:
- Общий объем ваших дисков, в моем примере это 5,3 ТБ
- Состояние контроллера (Status) - если все хорошо, то статус должен быть Optimal
- Drives - количество физических дисков
- Drive groups - количество датасторов
- Virtual Drives - количество виртуальных дисков
Тут же есть область "Action", позволяющая загрузить конфигурацию, обновить прошивку RAID контроллера, настроить звуковой сигнал предупреждения. Справа есть ссылки на документацию. Снизу вы увидите текущие события на вашем контроллере LSI/Avago. Вкладка "Physical" покажет ваши физические диски, выбрав любой из них вы увидите дополнительные свойства.
Вкладка "Logical" позволяет уже взаимодействовать с логическими сущностями. Например вы можете добавить HDD/SSD в существующий RAID массив. Вы легко можете изменить свойства любого Virtual Drive, изменить вид кэширования, включить или отключить инициализацию.
Методы создания различных видов RAID через MSM я подробно описывал. Чаще всего есть поддержка всех видов, но в некоторых контроллерах RAID 50 и 60 нужно разблокировать с помощью специального кода.
Утилита StorCLI
Инструмент StorCLI - это утилита командной строки, которая имеет больший функционал в отличии от графических аналогов LSA и MSM. Утилита очень простая и гораздо удобнее, по крайней мере с случае с Vmware ESXI, на которую порой установить MSM/LSA. это целая эпопея.
Всем привет, после того, как мы с вами рассмотрели, как создать RAID на контроллере LSI MegaRAID, нужно узнать, механизм сохранения конфигурационного файл на Raid controller LSI. А то мало ли что, лучше иметь файлик в 50 кб, чем голую железку. Это можно сказать резервная копия наших настроек, она так же хранится в размазанном виде на самих жестких дисках. Желаю, чтобы никому из вас никогда не приходилось ее применять в восстановительных целях.
Запускаем MegaRAID SMIS Providers и ищем ip адрес вашего сервера.
Как сохранить конфиг файл на Raid controller LSI-01
Вводим логин и пароль, напомню, что логин по умолчанию в Open-E это raid.
Как сохранить конфиг файл на Raid controller LSI-02ъ
Попадаем на дашборд, переходим на вкладку physical.
Как сохранить конфиг файл на Raid controller LSI-03
Вверху в меню Go to выбираем Save Configuration
Как сохранить конфиг файл на Raid controller LSI-04
Задаем место хранения и название файла. Советую писать модель контроллера LSI и название сервера.
Как сохранить конфиг файл на Raid controller LSI-05
Восстановление сохраненной конфигурации
Если надумаете восстановить сохраненный ранее конфигурационный файл, то для это в MSM вам для начала нужно очистить текущую конфигурацию, для этого выберите пункт "Clear Configuration", а затем нажмите "Load Configuration". Так же эти действия можно сделать и через BIOS подобное меню при загрузке сервера.
Всем привет, очень рад, что вы снова зашли на мой IT блог. Сегодня я хочу рассказать поучительную историю, о том, как из-за невнимательности можно сильно попасть в не хорошую ситуацию из которой будет, очень сложно выйти без надлежащего опыта. Будет некий такой траблшутинг по восстановлению lsi raid массивов при замене вышедшего из строя диска. Думаю, что для людей, кто только знакомиться с избыточными массивами данных, будет очень полезно поучиться на чужом опыте.
Предыстория
В любом сервере рано или поздно начинают выходить из строя жесткие диски или ssd и преждевременная замена спасает вас от потери данных. Но при замене бывает такая вещь как человеческий фактор, который может все погубить.
И так есть сервер IBM с raid контроллером M5015 что в градации LSI 9260-8i. В lsi raid контроллере если диск начинает выходить из строя, то начинает срабатывать счетчик Pred Fail Count и диск следует менять. Как заказать замену диска у IBM я уже рассказывал, останавливать на этом не буду. Допустим диск вы получили и вам осталось его заменить, вы меняете его и обнаруживаете что вытащили не тот диск, что будет дальше.
А дальше все зависит от вида raid собранного у вас. У меня на lsi raid контроллере был raid 10. И когда мой коллега вытащил не тот диск, то с ним ничего не случилось, но если вы засуните на его место новый диск или опять тот же что вытащили, то рейд не восстановится. Новый диск будет видится как unconfigured good а старый как foreign, то есть потерянный.
Тут после возврата старого диска сразу нужно было выполнить процедуру описанную ниже и все бы восстановилось, но бывает что приходит мысль, поменять еще в данной ситуации выходящий из строя диск на новый, и вот тут LSi контроллер, дабы не потерять данные переводит локальные луны в offline, что выражается в остановке сервисов или частичной остановки, на данных дисках.
Восстановление lsi raid
Раз уж так произошло, то не спешите паниковать все еще можно восстановить. Первым делом когда вы вернули не правильно вытащенный диск обратно и он получил статус foreign, на нем осталась конфигурация и ее следует обратно импортировать. Делается это следующим образом. Вы должны были заранее установить утилиту MegaRAID Storage Manager (MSM), в моем случае она стоит на Vmware ESXI 5.5, но может быть и на Windows платформе. Заходим в нее и выбираем пункт Physical и выбираете raid контроллер.
Теперь открываем пункт Go to > Scan Foreign Configuration. Выполняем сканирование имеющихся конфигураций.
У вас появится окно с импортированием конфигурации.
ни в коем случае не выбирайте Clear: Remove logical configuration, если только не решили затереть диск
Вас спросят действительно ли вы хотите это сделать жмем yes.
Если у вас не стоит MSM то вам придется перезагрузить хост и зайти в bios подобное меню. В котором будет приблизительно вот такое окно, где нужно так же импортировать конфигурацию.
После данной манипуляции ваши локальные lun перейдут в режим online и если вы до этого заменили сбойный диск на новый, то пойдет процедура rebuild. После чего raid перестроится и начнет нормальное функционирование.
Дополнение относительно SSD
Относительно SSD дисков, будьте осторожны, особенно если они в RAID-1, из практики могу привести случай, когда вылетевший диск, при возвращении его в строй, убил RAID массив и перезаписал рабочий SSD. В таких случаях, за место возвращения пропавшей конфигурации, по возможности вынимайте SSD и полностью с него удаляйте все разделы, проверяйте его на предмет ошибок и здоровья, и после этого возвращайте в RAID, чтобы начался автоматический ребилд.
Я хочу рассказать вам о том, как я восстанавливал прошивку RAID-контроллера LSI MegaRAID после неудачного обновления.
Когда эта беда случилась со мной, то информации об этом я практически не нашел, хотя, допускаю, что плохо гуглил.Анамнез
В своей работе я уже достаточно давно использую серверы Supermicro, так как у них есть большой выбор платформ, достаточно демократичная цена и приличная надежность.
Зачастую, особенно в случае с 1U серверами я беру их уже с интегрированным контроллером LSI MegaRAID.
Но проблема с ними заключается в том, что сама Supermicro не очень охотно выкладывает прошивки для встроенных контроллеров, так что я их обычно прошиваю актуальной прошивкой (масло масляное, да) от аналогичного контроллера LSI. Проблем не возникало до этих пор.
Недавно привезли несколько серверов с контроллерами LSI 2208 на борту и достаточно старой прошивкой.
Т.к. дискретные контроллеры на этих чипах я тоже активно использую, то особо не сомневаясь загрузился с флешки с Linux-ом, запустил привычное:
и пошел заниматься дальше своими делами.Делаю Reset и вижу такую картину:
Да, беда. Поиски в интернетах не привели к какому-либо результату. Судя по всему, проблема достаточно редкая.
Лечение
Я попробовал загрузиться с флэшки и прошить контроллер заново, но ни под DOS, ни под Linux утилита MegaCli его уже не определяла вообще. Прошивать, соответственно, тоже отказывалась.
Так что я обратился в саппорт LSI, где добрый человек с индусским именем указал мне на документацию к MegaRAID, а именно на страницу 305, где есть такой достаточно незаметный подраздел, который толком не объясняет зачем же делать то, что в нем написано:
Ага, подумали партизаны, наверное это прошивка в режиме восстановления, и взялись за дело.
Под Windows флэшку с FreeDOS сделать проще всего используя утилиту Rufus, буквально в один клик.
Под Linux сделать аналогичное можно подручными средствами (используя syslinux или GRUB), на эту тему есть много статей.Обращаю внимание, что указывать адаптер (опция -a) не нужно, судя по всему он прошивает все какие найдёт, либо первый попавшийся на PCI шине.
Прошивка в этом режиме занимает достаточно долгое время, около 15 минут, так что наберитесь терпения.
Когда он закончит — выключаем сервер по питанию, включаем его обратно и ждем чуда.
Но вместо чуда видим мы такую вот безрадостную картину:Гугление по такой ошибке приводит к единственной ссылке на блог нашего соотечественника, где он на чистом английском советует отключить от контроллера BBU, вынуть контроллер из сервера и потом поставить обратно.
В моем случае вынуть карту из сервера можно только лобзиком, BBU у меня нет, так что не вариант.
Пробую прошить стандартным способом, MegaCli обнаруживает контроллер, но говорит то же самое, мол F/W is in fault state, так что ничего делать не буду.Обращаемся опять в саппорт, который разводит руками и советует попробовать LSI Pre-Boot USB and CD tool, а если он не поможет, то сдавать железо назад.
Ок, качаем ISO, подключаем его через IPMI к серверу и грузимся.
Выбираем в меню загрузки пункт recovmr, затем нам предлагают написать в командной строке recover и наступит счастье. Но не наступило.
BAT-файл не может найти подключенный диск D:, видимо драйвер CDROM в FreeDOS на этом образе LSI не дружит с виртуальным приводом IPMI.Хорошо, заглядываем в BAT файл и смотрим, что же он там собирался делать:
Открываем ISO, ищем этот загадочный файл и видим, что он размером аж 16 мегабайт (да, мы уже догадывались из названия), что вдвое больше стандартной прошивки. Видимо, этот образ ROM полностью переписывает микросхему Flash на контроллере.
Пытаемся прошить его так же, как это собирался делать BAT-ник, но получаем знакомое: F/W is in fault state
Да, так себе Recovery-образ подготовила нам LSI.
Ладно, используем наш предыдущий опыт и пытаемся прошить этот файл через Mode0.На этот раз прошивка заняла минут 30, так как файл вдвое больше обычного. После прошивки обесточиваем сервер, включаем его обратно и видим заветный экран:
Салют, шампанское, сервер спасён!
Но этот живительный образ содержит не самую свежую версию прошивки, так что я с легким сердцем опять загрузился с FreeDOS-флешки и пошел прошивать его свежей прошивкой от Supermicro… и опять получил зависание на той же стадии, как в самом начале:
Круг замкнулся. Я даже для верности оставил его в таком виде на ночь, но ничего не изменилось.
После перезагрузки имеем опять битую прошивку.Методом проб и ошибок было выяснено, что после прошивки образа восстановления нужно сделать сброс к заводским настройкам:
и выключить-включить сервер.
После этого прошивается уже без зависания, и мы видим свежую версию прошивки:
Всё, на этот раз получилась 100% победа над непокорным железом!
Выписка
Мораль сей басни такова: если не хочется потратить пару дней на восстановление или еще больше на возврат оборудования, то лучше все-таки прошиваться предназначенными производителем железа прошивками (если он их выкладывает, у того же Supermicro я ее нашел только копаясь в дебрях FTP — на странице сервера или материнской платы ссылок нет), либо ничего не трогать и жить с той, которая уже есть.
Хотя я не уверен что проблема была вызвана именно «инородной» прошивкой, а не каким-то случайным глюком, но проверять это еще раз мне не хочется.Бывают и такие случаи, когда прошивка просто по какой-то причине портится (выключили электричество во время прошивки или еще какой гамма-всплеск случился в ближнем космосе), и тогда придётся прибегнуть к аварийному восстановлению.
Надеюсь, что эта статья поможет тем, кто наткнётся на похожую проблему в будущем.
Читайте также: