Ibm сервер не стартует с видеокартой
Привезли сервер с Intel Server board S5500HCV и двумя ксеонами 2 в ней. Подключаю в серверной в розетку - выдает 3 длинных гудка и не грузится вообще. Даже лого интела не появляется. Иногда все таки начинает грузиться, появляется логотип Intel, системник выдает три коротких звуковых сигнала и дальше не грузится. Соответственно зайти в BIOS не возможно, посмотреть какую либо информацию никак. Отношу системник в соседний кабинет, подключаю в розетку там - все грузится и работает О_О
Есть обоснованное подозрение, что что то не так в электрической сети. Поставил стабилизатор напряжения в серверную, показывает на входе-выходе 238.7 вольт. Пробовал выставлять на понижение, сервер так же не грузится. Подключил стабилизатор к розетке в соседнем офисе: те же 238,7 вольт. Но там комп включается нормально. Что это может быть и как заставить работать эту железяку везде, а не где только ей заблагорассудится?
Конфигурация компьютера | |
Процессор: Intel i7-7700 3.6 GHz | |
Материнская плата: ASRock H270M Pro4 | |
Память: 2 x 8 Gb Samsung | |
HDD: SSD Samsung 950 Pro 256Gb + ST1000DM003 1Tb | |
Видеокарта: Gigabyte GTX 1070 | |
Звук: Creative Sound Blaster Z | |
Блок питания: Chieftec Nitro 2 (BPS-650C2), 24.02.2016 | |
Монитор: Samsung S24E390 24'' | |
ОС: Windows 10 Pro x64 |
А такой странный совет: проверьте в серверной наличие (вернее отсутствие наличия) какого-либо напряжения на заземляющих контактах розеток. Офтоп конечно, но у меня както оборвался спуск на контур заземления - отключился копир А3 Панасоник, включаю в соседнюю розетку без заземл. контактов - работает.
Привет, Хабр! В прошлых статьях мы касались ошибок и проблем с серверами Dell и HP, и наш рассказ об ошибках refurbished-серверов был бы неполон без упоминания продукции третьего вендора «большой тройки» — IBM. Хотя эта славная корпорация уже отошла от производства серверов, её продукция ещё активно используется. Поэтому спешим поделиться с вами накопленным опытом «укрощения» серверов IBM. Это не исчерпывающий список проблем, но всё же он может оказаться кому-то полезен.
Ошибка обновления iDRAC
Напомним, что iDRAC представлен в вариантах «стандартный», «экспресс» и «enterprise». Стандарт идёт в комплекте при покупке сервера. Если заказываем комплектацию «экспресс», то на материнскую плату сервера нам ставят соответствующую лицензионную микросхему. Таким образом, мы получаем новый порт, который позволяет нам получать более информативные данные через Web.
При стандартной лицензии, когда мы на рабочем компьютере подключаемся через браузер к системе iDRAC, мы можем увидеть обзор информации о системе на стандартной вкладке, сервис-тег сервера, модель и не более того.
Через экспресс, т. е. если у нас 7 версия iDRAC, мы уже можем обновлять BIOS, Lifecycle, и т.д. непосредственно через систему удалённого доступа iDRAC. В ранних версиях системы, к сожалению, эта возможность не предусмотрена: там можно обновляться только через флеш-накопитель.
Enterprise – самый полный комплект доступных функций по управлению сервером через порт iDRAC, который позволяет полноценно отслеживать и обновления, и полный список компонентов, и текущее состояние сервера. Это удобный и функциональный комплект, но мы сумели найти в нём один небольшой, но существенный недостаток.
После обновления версии iDRAC Enterprise 1.30.30 либо 1.45.45, система перестаёт инициализироваться и не стартует из-за неправильных настроек. Как результат, если мы входим в iDRAC в настройках через BIOS, мы не можем его ни отключить, ни что бы то ни было предпринять для того, чтобы восстановить его или перезагрузить.
Для большинства пользователей, единственный выход в такой ситуации, это обращение в техподдержку. Если ваш сервер на гарантии, то специалисты приедут и заменят материнскую плату. Мы, в свою очередь, сталкивались с этой проблемой и, как ни странно, помогло вполне стандартное решение, описанное на официальном форуме Dell: сервер пришлось обесточить на 5 минут, вытащить блоки питания и отключить все провода. Правда, если это не помогло, то вам, всё же, придётся заменить материнскую плату.
Первый запуск
Наступает момент истины: осталось подключить кабель, идущий от монитора к видеокарте, и можно включать компьютер. Если все сделано правильно, то на экране появится изображение. Если же изображения нет, не стоит расстраиваться — проверьте все места подключения.
Оперативная память
Серверы IBM чувствительны по отношению к конфигурации модулей памяти. Зачастую после самостоятельного апгрейда — добавления памяти или её замены — сервер не загружается, либо видит меньше памяти, чем установлено на самом деле. К счастью, в подобных ситуациях не приходится долго гадать о причинах сбоя: на диагностической панели (если таковая имеется) загораются два индикатора Config и Memory.
Поэтому, прежде чем апгрейдить память обязательно изучите спецификацию, память какого типа и объёма поддерживается вашим сервером. Также большое значение имеет количество процессоров в сервере — от этого зависит порядок размещения модулей в слотах. Это тоже необходимо уточнить в спецификации.
Вообще, с памятью ровно такая же ситуация, как описано в статье про HP, например. Вкратце:
- Соблюдайте канальность памяти.
- Ставьте ECC REG 1(2)Rx4 память в двухпроцессорные системы и UDIMM — в однопроцессорные.
- Ставьте одинаковый объём памяти на каждый процессор.
А что делать, если вы вставили память в соответствии с инструкциями, а сервер всё равно не работает и предательски горит индикатор Memory? В этом случае придётся проверять разные варианты:
- Этот тип памяти не поддерживается сервером. Внимательно сверьтесь со спецификациями.
- Память оказалась «битой». Замените линейку на точно такую же и проверьте, заведётся ли сервер.
- Засорился пылью слот на материнской плате. Это довольно популярная причина, если сервер трудится уже несколько лет, а тем более если вы его не первый владелец. Продуйте слоты сжатым воздухом.
- Загнутый контакт в сокете. Такое бывает очень редко, но всё же бывает: память отказывается работать из-за загнутого контакта в сокете процессора. Если предыдущие варианты не помогли найти причину сбоя, снимите процессор и внимательно осмотрите сокет. Если вы оказались в числе немногочисленных «счастливчиков», то можете попробовать осторожно выпрямить погнутый контакт, но это исключительно на ваш страх и риск.
Подключите кабели питания
На каждом блоке питания есть кабель, который отвечает за питание PCIe-устройств. Внешне его можно спутать с разъемом питания для процессора, но распиновка контактов у них несколько другая, и без дюжей силы вставить одно в другое просто не получится. К тому же все разъемы на блоках питания обычно подписаны.
Найдите подходящий кабель — это может быть один, два шестипиковых или восьмипиковых или даже три восьмипиковых разъема питания PCIe. Количество разъемом напрямую зависит от производительности и прожорливости видеокарты, возможно, что для вашей видеокарты и вовсе не требуется дополнительное питание.
Почти все видеокарты используют шестипиновое или восьмипиновое соединение или их комбинацию. Однако некоторые модели из недавней серии RTX 3000 от Nvidia используют 12-контактный разъем. Для этого вам понадобится адаптер, который превращает два восьмиконтактных разъема в один 12-контактный.
Настоятельно не рекомендуется при отсутствии необходимых разъемов у блока питания использовать всевозможные переходники с molex и sata-кабелей. В таком случае наилучшее решение — замена блока питания.
Intelligent Provisioning и обновление сервера
В серверах HP ProLiant Gen8 и Gen9 используется мощный инструмент Intelligent Provisioning, позволяющий сконфигурировать сервер, обновить прошивки некоторых компонентов и контролировать «железную» часть машины. Иногда при попытке обновления выдаётся ошибка о невозможности подключения к базе данных HP. Причина заключается в устаревшей версии самой Intelligent Provisioning. Обновить её можно следующим образом:
- Для Gen8 скачайте образ Intelligent Provisioning recovery media версии 1.62b, а для Gen9 — самую свежую версию.
- Смонтируйте образ с помощью iLO или запишите на CD/DVD. Не записывайте образ на флешку, при запуске с неё Intelligent Provisioning не обновится.
- При загрузке сервера выберите опцию One Time Boot to CD-ROM.
- Когда сервер загрузится с диска (или образа), то в случае с Gen9 выберите в меню пункт Interactive HP Intelligent Provisioning recovery media. На сервере Gen8 обновление начнётся автоматически.
- На следующем экране нажмите кнопку Reinstall Intelligent Provisioning, дождитесь завершения и перезагрузитесь штатно (только для Gen9).
Есть два варианта полного обновления сервера.
- Вручную скачать и установить все необходимые драйверы и прошивки для вашей модели сервера. Этот вариант удобен, если сервер один и на нём уже есть ОС.
- Если серверов несколько и на них развёрнута Windows, то целесообразнее воспользоваться сервис-паком Service Pack for ProLiant (SPP).
- Нужно скачать образ сервис-пака.
- Установить программу HP USB Key Utility for Windows.
- С помощью этой программы развёртываем образ сервис-пака на флешке объёмом не меньше 8 Гб.
- Загружаем сервер с флешки. Рекомендуем выбрать Interactive Firmware Update, так можно контролировать процесс обновления.
- После загрузки клиента выбираем Update Firmware. Когда оборудование будет проверено, система предложит список обновлений, которые будут установлены после нажатия на кнопку Deploy.
- После завершения обновления необходимо перезагрузиться. Сервер несколько раз включится и выключится, устанавливая прошивки, после чего произойдёт штатная загрузка.
Ошибка Е1410
Ошибка Е1410 выдаётся после апгрейда: вы добавили ещё один процессор, но с ним сервер почему-то не стартует. Вернее, он включается, индикаторы попеременно загораются, он громко шумит, но при этом на экране ничего нет и пишет ошибку на дисплее диагностической панели.
Как вы уже догадались, при данной ошибке второй процессор не стартует потому, что часть функциональности первого процессора оказалась отключена. Какая именно? Вариантов может быть множество, одни из них: либо это ножки отвечающие за старт второго процессора, либо блок оперативной памяти не стартует от второго процессора. Это зависит от того, какая ножка загнута.
Хаотичная перезагрузка сервера
Эта проблема встречается редко, и выражается в хаотичной самостоятельной перезагрузке сервера. В логах ОС ошибок нет, логах iLO тоже обычно ничего критичного. В подобных ситуациях обычно не помогает обновление ПО, замена кабелей питания и ИБП. Проблема решается сменой настроек управления питанием в БИОСе сервера. Вкратце, отключаются все механизмы снижения тактовой частоты процессора:
- Power Management Options —> HP Power Profile —> Maximum Performance
- Power Management Options —> HP Power Regulator —> HP Static High Performance Mode
- Power Management Options —> Advanced Power Management Options —> Collaborative Power Control —> Disabled
- Power Management Options —> Advanced Power Management Options —> Minimum Processor Idle Power Core State —> No C-States
- Power Management Options —> Advanced Power Management Options —> Minimum Processor Idle Power Package State —> No Package State
Оперативная память
При апгрейде серверов HP (да и не только) часто возникают трудности с подбором оперативной памяти. Как показывает практика, даже опытные сисадмины и инженеры не всегда сведущи в этом вопросе. Если по наитию устанавливать модули памяти, то, вероятнее всего, сервер просто не запустится. При неправильной конфигурации RAM возможен и более мягкий вариант: машина работает, но не с максимальной производительностью.
Для многопроцессорных серверов HP, как правило, необходимо использовать только регистровую память c функцией коррекции ошибок (ECC RDIMM), а для однопроцессорных — небуферизированную с ECC (UDIMM). Хотя официальные мануалы гласят, что UDIMM можно ставить и в многопроцессорные серверы, делать этого не стоит по нескольким причинам:
- Ограничение по объему памяти. Как правило это 24-32 Гб на CPU.
- Планки UDIMM, как правило, должны быть «родные» HP, иначе могут происходить самопроизвольные перезагрузки сервера. Это явление зафиксировано как минимум на трёх моделях: DL380p Gen8, DL360e Gen8, ML310e Gen8v2. В то же время, можно без проблем ставить RDIMM-память любого вендора.
Преимущество UDIMM памяти в том, что она работает несколько быстрее RDIMM, в которой присутствует буферная операционная задержка. Однако, при правильной конфигурации памяти в многоканальных системах RDIMM может превосходить небуферизированную память в производительности. Нельзя одновременно устанавливать RDIMM и UDIMM-модули.
Отличить UDIMM-память от RDIMM можно по наклейке. Например, если написано 12800R, то это регистровая память, если 12800E, то небуферизированная с ECC.
При установке RDIMM следует отдавать предпочтение одно- и двухранговой памяти (1rx4, 2rx4). В отличие от тех же IBM (Lenovo), серверы HP чувствительны к конфигурации памяти. При установке модулей рекомендуется равномерно распределять память как между процессорами сервера, так и между каналами. В противном случае сервер может просто не включиться, или его производительность окажется сниженной. Вольтаж планок в серверах HP не принципиален, но всё равно старайтесь устанавливать одинаковые по вольтажу планки.
Когда речь заходит об апгрейде или ремонте серверов, то возникает вечный вопрос о производителе комплектующих. Кто-то использует исключительно оригинальные компоненты, не считаясь с расходами, а кто-то подбирает совместимые комплектующие от сторонних производителей. Мы считаем, что здесь нужно учитывать:
- Степень совместимости сторонних комплектующих.
- Разницу в стоимости по сравнению с оригинальными.
- Информацию о надёжности сторонних комплектующих.
- Уровень и допустимость рисков при использовании сторонних комплектующих.
Не определяются сетевые адаптеры
Если обновить драйверы Emulex для сетевых адаптеров с версии 3.х.х сразу до версии 10.х.х, то при перезагрузке сетевые адаптеры могут перестать определяться. Для предотвращения этой проблемы рекомендуется сначала установить Emulex 4.х.х, а затем самую свежую версию. Избежать этой ошибки можно иначе: сначала обновиться с образа OneConnect, а затем с Service Pack for ProLiant. А если адаптеры уже перестали определяться, то просто обновитесь с образа OneConnect.
Как установить, подключить и настроить видеокарту
Обновление видеокарты — одно из самых простых действий, которое значительно повысит игровую производительность вашего компьютера. Как и с другими компонентами, для установки новой видеокарты нужно извлечь старое устройство. Вроде все выглядит очень просто, но давайте разберем процесс установки чуть более подробно. В статье вы узнаете, как самостоятельно установить, подключить и настроить видеокарту.
Установка второго рейд-контроллера в серверы Gen8 и Gen9
При установке второго рейд-контроллера (например, один рейд под системы, второй под данные) сервер может зависать на стадии загрузки ОС или не проходить POST. Чаще всего это происходит из-за неправильной boot-очереди.
Для решения проблемы нужно сделать следующую конфигурацию:
- Рейд1 (например, встроенный P420i).
- Рейд2 (софтовый или embedded-рейд, например B120i, P222i).
- Рейд3 (аппаратный P420).
Начало
Перед тем, как вытаскивать старую видеокарту, удалите установленные драйвера. Лучше всего воспользоваться специальной утилитой Display Driver Uninstaller.
Название говорит само за себя, утилита не просто удаляет драйвера, она полностью вычищает из системы старый драйвер. Это необходимо сделать во избежание всевозможных конфликтов драйверов. Довольно часто подобное наблюдается с драйверами от компании AMD. Особенно эта процедура рекомендуется, если вы меняете видеокарту AMD на Nvidia и наоборот. Программа имеет очень дружественный интерфейс и русскую локализацию, есть также дополнительные настройки для продвинутых пользователей.
В программе выбираем производителя вашей старой видеокарты и выбираем одно из трех возможных действий. В нашем случае это «Удалить и выключить компьютер».
После выключения компьютера выключите также блок питания. Для этого на нем есть специальная клавиша.
Извлекаем старую видеокарту
Первым делом отключаем кабель, идущий от видеокарты к монитору. Затем отключаем кабели питания, они имеют специальную защелку. Для того чтобы вытащить кабель, нужно надавить на защелку.
Если все сделано правильно, он вытащится достаточно легко. Далее выкручиваем болт, которым видеокарта прикручивается к корпусу.
В зависимости от позиционирования корпуса это может либо болт, либо защелка.
Чтобы извлечь видеокарту из слота PCI Express материнской платы, нужно также нажать на специальную защелку, она так же имеет два положения "открыт" и "закрыт".
Открыто
Закрыто
Тут следует быть очень осторожным и тянуть видеокарту на себя потихоньку. Когда вы начнете вытягивать карту, защелка снова может закрыться, обращайте на нее внимание при вытаскивании.
Иногда вытаскиванию видеокарты могут мешать разъемы подключения монитора DVI и VGA, особенно на старых видеокартах из-за конструкции корпуса. Можно слегка покачать карту вверх-вниз.
После вытаскивания видеокарты рекомендуется продуть разъем PCI Express от пыли.
«Особенность» серверов HP DL360p Gen8
Изначально модель данной серии была рассчитана на процессоры E5-26xx первой ревизии, но в 2013 году Intel выпустила вторую итерацию — V2. Вендоры, в том числе HP, стали обновлять линейки. Dell и IBM не стали инженерно менять базу, лишь материнские платы стали носить другой парт номер. А в HP пошли другим путём. В итоге на рынке есть две модели HP DL360p, ничем не отличающиеся, за исключением крепежа радиаторов. В первой версии крепление рычажное, во второй — винтовое.
По сути, мелочь. Однако, может привезти к дополнительным расходам. Поэтому, если вы решите установить второй процессор, обязательно узнайте ревизию своего сервера (по серийнику, либо заглянув под крышку).
Парт номер старого рычажного радиатора — 654770-B21.
Парт номер нового винтового радиатора — 712731-B21.
Оперативная память
Серверы IBM чувствительны по отношению к конфигурации модулей памяти. Зачастую после самостоятельного апгрейда — добавления памяти или её замены — сервер не загружается, либо видит меньше памяти, чем установлено на самом деле. К счастью, в подобных ситуациях не приходится долго гадать о причинах сбоя: на диагностической панели (если таковая имеется) загораются два индикатора Config и Memory.
Поэтому, прежде чем апгрейдить память обязательно изучите спецификацию, память какого типа и объёма поддерживается вашим сервером. Также большое значение имеет количество процессоров в сервере — от этого зависит порядок размещения модулей в слотах. Это тоже необходимо уточнить в спецификации.
Вообще, с памятью ровно такая же ситуация, как описано в статье про HP, например. Вкратце:
- Соблюдайте канальность памяти.
- Ставьте ECC REG 1(2)Rx4 память в двухпроцессорные системы и UDIMM — в однопроцессорные.
- Ставьте одинаковый объём памяти на каждый процессор.
А что делать, если вы вставили память в соответствии с инструкциями, а сервер всё равно не работает и предательски горит индикатор Memory? В этом случае придётся проверять разные варианты:
- Этот тип памяти не поддерживается сервером. Внимательно сверьтесь со спецификациями.
- Память оказалась «битой». Замените линейку на точно такую же и проверьте, заведётся ли сервер.
- Засорился пылью слот на материнской плате. Это довольно популярная причина, если сервер трудится уже несколько лет, а тем более если вы его не первый владелец. Продуйте слоты сжатым воздухом.
- Загнутый контакт в сокете. Такое бывает очень редко, но всё же бывает: память отказывается работать из-за загнутого контакта в сокете процессора. Если предыдущие варианты не помогли найти причину сбоя, снимите процессор и внимательно осмотрите сокет. Если вы оказались в числе немногочисленных «счастливчиков», то можете попробовать осторожно выпрямить погнутый контакт, но это исключительно на ваш страх и риск.
Процессоры
При замене процессоров на более мощные необходимо выяснить в спецификации сервера, какие модели процессоров он поддерживает. Не забывайте учитывать при этом поддерживаемое TDP радиатора и самого CPU. В большинстве случаев это помогает избежать возможных проблем.
Однако при наращивании количества процессоров ни в коем случае нельзя пренебрегать установкой кулеров на каждый из них, полагаясь на кондиционирование серверного помещения. Каждый вентилятор охлаждает определённые зоны на материнской плате. Без штатного охлаждения многократно повышается риск временного перегрева процессоров и оперативной памяти, вплоть до выхода сервера из строя вследствие расплавления или выгорания электронных компонентов.
После установки в сервер двух процессоров на порядок мощнее одного стокового он может не включиться. Например, в нашем случае это было с сервером HP ML350p Gen8. Причина в том, что у некоторых моделей на материнской плате есть предохранитель, блокирующий подачу питания, если требуемое напряжение превышает некий базовый порог. Если эта блокировка срабатывает, то единственным вариантом остаётся только замена материнской платы. Если сервер не на гарантии, то это может влететь в копеечку, так как HP славится немаленькими ценами за свои железки.
Однако есть методика обхода этой защиты. Допустим, вместо одного или двух процессоров начального уровня E5-2609 (v1/v2/v3) нужно установить два производительных E5-2690 (v1/v2/v3). Чтобы избежать проблем при апгрейде лучше всего поступить так:
- Обновить всё ПО до последних версий (iLO, BIOS, AHS и т.д.)
- Дождаться полной инициализации сервера с обоими установленными E5-2609.
- Установить два процессора «промежуточного» уровня, например, E5-2640. Дождаться окончания POST-проверки.
- И только после этого установить желаемые E5-2690.
Обновление ПО
Проблема при обновлении ПО актуальна для оборудования DELL старше 3-5 лет. Напомним, что все манипуляции с сервером Dell производятся при помощи Lifecycle, которая встроена в программное обеспечение сервера, а также iDRAC.
Интегрированный контроллер удаленного доступа Dell 7 (iDRAC7) — программное обеспечение для серверов Dell, которое удаленно подключается к серверу, даже если у сервера нет питания, но подключен интернет и блок питания. При подключении к серверу, ПО выводит на экран данные о состоянии системы, а также позволяет протестировать и обновить все компонентами: начиная от биоса и заканчивая драйверами на материнскую плату, блоки питания и т. д., а также прошивку.
Здесь, при стандартном сценарии, есть два варианта. Первый, обновление в ручном режиме, с флеш-карты — в случае, если нет подключенного к серверу интернета. Тогда заходим в Lifecycle и обновляемся с флеш-накопителя. Если что-то не пошло, подключаем сервер к интернету и обновляемся, либо заходим через iDRAC и восстанавливаем первоначальные настройки, устанавливаем необходимые обновления.
Однако, если сервер достаточно старый, проблемы ждут почти сразу: при попытке установить программное обеспечение через Интернет из системы обновления и диагностики Lifecycle. Причина такой проблемы в том, что производитель изначально, ещё на заре этой системы, не использовал протокол защиты на FTP — сервере обновления прошивок компонентов своих серверов. Сейчас, когда такие сертификаты защиты введены, старое оборудование трёх-пятилетней давности выпуска иногда с трудом может обновиться через Интернет.
Решается проблема достаточно просто и многие из вас уже наверняка догадались, как это можно сделать: обновить ПО, а именно Lifecycle, но сначала обновите систему IDRAC. Обновления доступны бесплатно на официальном сайте техподдержки Dell. (Проверка гарантии и скачивание обновлений на ваш сервер Dell).
После этой манипуляции вы сможете удобно загрузить все драйверы и остальные обновления через Интернет, вне зависимости от года выпуска вашего сервера — если, конечно, на сайте производителя есть для него набор обновлений.
Сброс конфигурации в серверах Gen8
Напоследок хотим рассказать не об ошибке, а о фиче серверов HP поколения Gen8 и Gen9: на материнских платах отсутствуют привычные джамперы сброса конфигурации. Если вам нужно воспользоваться сбросом, то это можно сделать следующим образом:
- Выключите сервер и выдерните шнур питания.
- Найдите на материнской плате группу маленьких переключателей “System Maintenance Switch” (см. изображение на внутренней стороне крышки сервера).
- С помощью тонкого инструмента — ручки, шила, иглы и т.п. — переведите переключатель №6 в положение ON.
- Подключите к серверу шнур питания.
- Если на экране появилось изображение и начался процесс сброса, дождитесь завершения процедуры NVRAM clear и перезапуска сервера. Если после подключения шнура питания на экране долго ничего не отображается, выключите сервер.
- Выключите сервер, вытащите шнур питания.
- Верните переключатель № 6 в положение OFF.
Проверка видеокарты
После установки новой видеокарты ее обязательно нужно проверить, можно любимым играми, а можно — специальным тестовыми пакетами.
Для этих целей лучше всего подходить приложений 3DMark, а для мониторинга за рабочей температурой — MSI Afterburner. Видеокарта — это технически сложное устройство, даже покупка совершенно новой видеокарты из магазина не гарантирует, что она на 100 % будет исправно работать, ведь производственный брак еще никто не отменял.
Приложение 3DMark не только поможет проверить работоспособность, но и оценит уровень производительности, чтобы вы могли сравнить уровень производительности аналогичных моделей или вашей прошлой видеокартой.
Данный результат является чем-то средним для серии видеокарт NVIDIA RTX 3070, что свидетельстует о нормальной работе устройства.
Сильный шум системы охлаждения
Эта проблема чаще всего проявлялась в серверах ML350e Gen8. Сразу после включения сервера вентиляторы выходят на высокие обороты. Скорость вращения не снижается при любой нагрузке. В результате создаётся постоянный и высокий уровень шума.
В ряде случаев проблема решалась удалением PCI-E карт расширения: сетевых и USB-хабов. Но эта проблема встречалась и в серверах без установленных плат расширения. Несколько раз помог демонтаж и повторная установка всех вентиляторов и их корзин, с переподключением проводов питания. Однажды вентиляторы вернулись к нормальным оборотам после обновления прошивок и сброса iLO. Также был случай, когда в БИОСе изменилась настройка управления охлаждением, и оказалось достаточно поменять значение с Increased на Optimal Cooling.
Возможно ли установить видеокарту на серверную мат. плату?
Здравствуйте, возможно ли установить видео карту (например Nvidia 780Ti) на один из серверов:
Сервер планируется использовать в качестве рабочей станции (для моделирования: 3ds max, Quixel SUITE, Unreal Engine 4; и для разработки на c++)
В контексте использования видеокарты серверные мат платы в принципе ничем особым не отличаются от десктопов.
- Вконтакте
- Вконтакте
Дмитрий Донской как уже заметил SyavaSyava установка видеокарты в эти сервера не возможна чисто с физической стороны, там просто на это нет места.
Теоретически можно пропилить в крышке "дырку" и всё это дело через переходник присобачить снаружи, но остаётся ещё вопрос питания.
В общем не извращайтесь, жалко хорошую железку портить 🙂
Присмотритесь к серверам в мидтавер корпусах, там вам и места хватит и как правило полноценные PCI-E присутствуют.
Сбой после выключения сервера
Мы сталкивались с несколькими случаями, когда при включении сервера светодиоды горят, но видеосигнал отсутствует. Машина не пингуется, iLO не отвечает, хотя по светодиодам отмечается активность iLO и Ethernet. Клавиатура и мышь не работают. Чаще всего такое случалось после штатного отключения сервера, без каких-либо манипуляций, без сбоев питания. Подобный сбой отмечался на серверах поколений от Gen5 до Gen8.
Точного решения этой проблемы, как и её причины, обнаружить пока не удалось. В одном случае помог перевод всех переключателей “System Maintenance Switch” в положение ON, а через некоторое время обратно в OFF. Однажды сервер ожил после того, как поменяли местами модули памяти. К сожалению, в нескольких случаях так и не удалось восстановить серверы.
Установка новой видеокарты
Устанавливать видеокарту лучше всего в самый ближний к процессору слот PCI Express. В большинстве случаев именно этот слот будет работать всегда в режиме х16 при наличии одной видеокарты.
Все дело в том, что количество линий PCI Express для обслуживания нужд подключенных устройств не безграничено, их количество напрямую зависит от выбранной платформы/сокета и даже логики материнской платы. Если одновременно к материнской плате подключены два и более устройств, которые используют линии PCI Express, то видеокарты при подключении во второй, третий или даже четвертый слот от процессора будут работать в режиме х8 или х4.
На практике это не так сильно сказывается на производительности, но инженеры в инструкции к материнской плате настоятельно рекомендуют использовать для подключения видеокарты именно первый слот.
Процесс достаточно прост, но может быть не очень удобен в зависимости от размера системы охлаждения процессора, корпуса и конечно габаритов самой видеокарты.
Перед установкой видеокарты убедитесь, что защелка на PCIe-разъеме открыта (опущена вниз).
Самые главное правило при сборке компьютера — не торопиться и не прикладывать больших усилий. Это как конструктор, где все детали идеально подобраны друг под друга нужно просто правильно их совместить.
Когда видеокарта полностью войдет в разъем PCI Express, замочек закроется с характерным щелчком. Затем обязательно прикрутите видеокарту к корпусу, ведь слот PCI Express не рассчитан на то, чтобы выдерживать вес видеокарты на себе, а с учетом веса современных видеокарт данное упущение может повредить как сам слот и, так и разъем у видеокарты.
Недостаточное количество блоков питания
Некоторые владельцы серверов HР с х4-бэкплейнами резервного питания (RPS), например, ML350 Gen9, недоумевают, почему для запуска машины требуется подключить не менее трёх блоков питания, чья суммарная мощность существенно превышает максимальное текущее потребление сервера.
Дело в том, что в ML350 Gen9 может быть установлено до 9 карт PCI-E и до 6 HDD-бэкплейнов (либо, к примеру, внутренний стример + 5 HDD-бэкплейнов). А всё это может потреблять очень много ватт. Бэкплейны RPS позволяют обеспечить избыточное питание сервера на случай резкого повышения нагрузки, а значит и потребления энергии. Подключение блоков питания к бэкплейну осуществляется по схеме N-1, где N — общее количество разъёмов. Если вам необходимо избыточное питание сервера, то блоки питания должны быть подключены ко всем разъёмам бэкплейна. Если избыточное питание не требуется, то для запуска сервера с х4-бэкплейном необходимо три блока питания, а с х2-бэкплейном — один блок.
Ошибка управления через IPMI
IPMI может использоваться для удалённого управления серверами. Возможны ситуации, когда не получается установить соединение со службой IPMI сервера:
ipmitool -I lanplus -H $ip -U $user -P $pass
Error: Unable to establish IPMI v2 / RMCP+ session
Причин может быть две:
- Служба отключена ради повышения безопасности: у IPMI v.2 есть потенциальная RAKP-уязвимость (Remote Password Hash Vulnerability). Нужно вновь включить службу.
- Используемый аккаунт не имеет прав администратора. В этом случае аккаунту нужно предоставить соответствующие права.
Накопители
Мы уже неоднократно упоминали о том, что совсем не обязательно устанавливать в серверах «родные» накопители. Ни IBM, ни другие вендоры их не производят, они лишь приобретают их у всем известных производителей, перепрошивают и клеят свои логотипы. Поэтому вы можете без труда сэкономить на апгрейде или восстановлении дисковых массивов, выбрав аналоги вместо «родных» накопителей. Двух-трёхкратная разница в цене это оправдывает, особенно если речь идёт о refurbished-серверах. В сети можно легко найти таблицы соответствия моделей, например:
Модель IBM | Оригинал |
---|---|
IBM 49Y2003 | Seagate ST9600204SS |
IBM 90Y8872 | Seagate ST9600205SS |
IBM 90Y8908 | Seagate ST9600105SS |
IBM 81Y9650 | Seagate ST900MM0006 |
Тем не менее, ещё возможны ситуации несовместимости «неродных» накопителей с сервером. В этом случае сервер не грузится штатно, либо не видит накопитель. Обычно это решается с помощью установки свежей прошивки RAID-контроллера. К слову, рекомендуется обновить прошивку и бэкплейна/экспандера, в этом вам поможет приложение IBM Bootable Media Creator (BoMC).
При включении сервера и прохождении POST-проверки возможно появление ошибки:
A discovery error has occurred, please powercycle the system and all the enclosures attached to this system.
Это сигнализирует о проблеме с одним из накопителей. Вычислить его просто: индикаторы на его салазках постоянно мигают, даже когда все остальные носители прошли проверку и перестали мигать.
С дисковой подсистемой бывают и более экзотические проблемы. Например, при использовании RAID-1 в фирменном приложении MegaRAID Storage Manager могут появиться ошибки вида:
ID = 63
SEQUENCE NUMBER = 48442
TIME = 24-01-2016 17:03:59
LOCALIZED MESSAGE = Controller ID: 0 Consistency Check found inconsistent parity on VD strip: ( VD = 0, strip = 637679)
Чаще всего это говорит не об умирании диска, а об ошибке контроля чётности — несовпадении данных на основном и вторичном дисках. Возможные причины:
- Нередко такие ошибки появляются сразу после конфигурирования нового массива или после замены одного из дисков.
- Во время сеанса диагностики поверхности блинов происходит инициализация диска и выполнение операций ввода/вывода. На RAID-1 это может привести к временному несоответствию томов, которое автоматически исправляется при следующей проверке на соответствие. Такое возникает не при любом сеансе диагностики, а когда сходятся звёзды:
- o Используется RAID-контроллер без кэширования, либо активирован режим Write Through.
- o Нехватка оперативной памяти, при которой с диска осуществляется активная подкачка страниц.
- o Просто очень интенсивное использование дисков.
Преимущества серверов Dell
Справедливости ради хотелось бы закончить статью, поговорив о плюсах серверов Dell. А они, по нашему мнению, полностью нивелируют те проблемы, которые мы описали выше. Ведь, в первую очередь, эти проблемы встречаются при реконфигурации серверов.
Мы продолжаем цикл публикаций о проблемах, с которыми сталкиваемся при подготовке refurbished-серверов. Ранее мы писали о серверах DELL, на этот раз речь пойдёт о продукции HP. Все эти проблемы решались нашими инженерами, и это лишь малая часть сюрпризов, которые могут преподнести серверы этого вендора. Однако, если вы самостоятельно занимаетесь обслуживанием серверов, то, возможно, наш опыт может вам пригодиться.
Накопители
При выборе новых накопителей для сервера ошибиться труднее, чем при изменении конфигурации памяти. Но всё же здесь есть свои подводные камни и, отчасти, мифы.
Бытует мнение, что для серверов HP нужно покупать накопители исключительно того же производителя. Это обосновывают тем, что все накопители с логотипом HP имеют фирменную прошивку. В этом случае «родные» диски существенно дороже. И, честно, говоря, это сомнительное удовольствие переплачивать в 2-2.5 раза. Однако сама корпорация Hewlett-Packard не производит накопители, она заказывает их у других вендоров. И как показывает опыт, во многих моделях серверов HP вполне можно использовать продукцию HGST, Toshiba, Seagate, Western Digital.
При выборе накопителей уточните, какие накопители поддерживает Raid-контроллер вашего сервера. Некоторые контроллеры не поддерживают SAS-накопители, также могут не поддерживаться накопители объёмом более 2-3 Тб.
Если сервер не видит сторонний накопитель при его подключении, то чаще всего это связано с неисправностью самого накопителя или Raid-контроллера. Ещё одна немаловажная деталь: ни в коем случае не ставьте в enterprise-серверы диски для десктопных систем. Судя по нашему опыту, можно выделить несколько наиболее популярных моделей «неродных» дисков, которые без проблем будут работать на серверах от G7 до Gen9:
- Seagate Savvio (SAS)
- Seagate Constellation (SATA/SAS)
- Seagate Enterprise Capacity (SATA/SAS)
- Seagate Enterprise Performance (SATA)
- WD VelociRaptor (SATA)
Обновление прошивок и ПО
Любопытная проблема может подстерегать при установке с нуля Windows 2012 или Windows 2012 R2 — свежеустановленная операционка не видит ни одного накопителя. Причём такое бывает не только с серверами IBM. Дело в том, что все накопители в сервере подключены через RAID, а упомянутые версии ОС не имеют вшитых драйверов для работы с RAID. И поэтому они их просто игнорируют. Как быть? Самый надёжный способ: использовать утилиту IBM ServerGuide. При установке ОС она принудительно подсовывает все необходимые драйвера для данной модели и версии операционной системы. Обратите внимание, что образ ОС должен устанавливаться с диска, а не с флэшки: ServerGuide не будет работать с образом на том же USB-носителе, с которого запущен сам.
При покупке серверов бывают ситуации, когда нужно сначала обновить все прошивки, а потом уже накатывать систему. Сделать это можно с помощью вышеупомянутой IBM Bootable Media Creator:
- Загрузитесь с загрузочной флешки или диска.
- Запустите BoMC от имени Администратора.
- Выберите, что вы хотите сделать: обновить и/или провести диагностику.
- Программа спросит, где ей взять драйверы: скачать самой или вытащить из указанного вами архива.
- Выберите носитель для записи загрузочного образа: флэшку или диск. Запись может идти несколько часов, не волнуйтесь, программа не зависла.
- По окончании записи загрузитесь с этого носителя, и далее по инструкции.
Но если не поможет, то воспользуйтесь процедурой обновления через BoMC.
Бывают и более неприятные ситуации, когда по закону подлости в ходе установки более свежей версии BIOS'а происходит сбой питания.
После этого сервер уже не может загрузить основную прошивку, и использует резервную. Если штатная процедура восстановления BIOS'а не помогает, то сделайте… даунгрейд: установите более старую прошивку, чем та, что была до сбоя питания. Обычно это помогает. После этого уже можно попытаться снова поставить свежую версию BIOS'а. Как говорится, шаг назад — два вперёд.
Некорректная установка оперативной памяти
Проблема часто встречается при апгрейде. В данном случае речь идёт целиком и полностью о человеческом факторе. Однако ошибка эта крайне распространена в силу того, что на каждую модель присутствует своя спецификация по установке. Во-первых, в зависимости от модели, почти в каждом сервере разное количество портов. Соответственно, определённое количество оперативки нужно добавлять в свои порты. Иногда задача усложняется многократно: например, у модели DELL R610 оперативная память трехканальная, поэтому необходимо добавлять по три планки на один канал. Легко можно ошибиться, выбирая из 12 слотов и 4 каналов.
Память типа DDR3 интерфейс состоит из трех каналов до двух модулей Rdimm или UDIMMs на канал
для одиночного или двойного ранга и до двух модулей Rdimm на канал для квадра ранга. Интерфейс использует 2 ГБ, 4 ГБ, 8 ГБ или 16 ГБ модулей Rdimm. Также поддерживается 1 ГБ или 2 ГБ UDIMMs.Поэтому часто получается при неверном расчете памяти одна из планок или несколько установлены в неверные слоты, либо вовсе не хватает для оптимальной конфигурации.
Второй момент, часто приводящий к несовпадению по оперативной памяти заключается в том, что память для серверов подразделяется по питанию на 1,35 V и 1,5 V. Оперативка 1,35 вольт стартует только на начиная с 56-й версии процессора. На более ранних версиях серверов можно использовать только планки, рассчитанные на 1,5 вольт. Если в сервере будут стоять разные планки, то он не запустится и выдаст соответствующую ошибку.
Выглядит это таким же образом как в случае с загнутыми сокетами и ошибкой запуска второго процессора. Если ошибки на экране дисплея не отображается, сервер пишет “Server is booting. ” и на экране ничего не отображается, попробуйте проверить конфигурацию памяти. Замените память в соответствии со спеками и установите в правильные слоты, чтобы получить оптимальную конфигурацию.
Преимущества серверов HP
Несправедливо было бы рассказывать только о проблемах серверов HP, ведь недаром продукция этого производителя пользуется высокой популярностью. Серверы серии Proliant считаются одними из лучших в своём классе, и уж точно запомнятся своей надёжностью, нежели отвалившимся iLO и несколько завышенной ценой. Именно HP зачастую задаёт планку в функциональности и отказоустойчивости серверов, предлагая нестандартные, но эффективные инженерные решения.
Вот зря придумали высказывание "нельзя впихнуть невпихуемое"! Сейчас, взяв в руки фотоаппарат (встроенный в телефон), я возьмусь опровергнуть это спорное заявление.
Дело началось с того, что на работе, в плане стандартного перетряхивания имущества, образовалась парочка лишних серверов. Которые, вследствие всемирного финансового кризиса было совершенно некуда девать: выход серверов из строя как-то совпал с сокращением нашей офисной площади. Пришлось мне идти к директору и слезно просить парочку домой: поиграться.
"Нафига тебе эти печки?" — удивился директор. — "Ты же потом за электричество не расплатишься!"
Но сервера отдал на мое злобное растерзание.
Один из них я уже даже успел приволочь домой и начать мучить.Сервер оказался интересной игрушкой, основанной на интеловском 5000Р чипсете. В двух сокетах были поселены инженерные семплы Xeon 5150 (два ядра, 2.66ГГц, 1.33ГГц шина). Заодно, потерзав собратьев по несчастью моего избранника, я наковырял восемь планок памяти — каждая по гигабайту (DDR2 ECC Registered, 553МГц).
Даже на сегодня подобная конфигурация может считаться неплохой основой для игрушек, даже невзирая на ее экзотичность.
С довольным рычанием я для начала переселил перепавшее мне хозяйство в нормальный корпус: изначально это дело жило в серверном корпусе на 5U. А потом меня постиг жестокий облом.
То, что я по ошибке принимал за слот PCI-E x16 на поверку оказалось слотом расширения для каких-то плат менеджмента. А вот слота для приличной видеокарты там не оказалось. Совсем.Пришлось думать, как же мне жить дальше.
Как вы видите, на серверной плате есть 3 слота PCI Express, два — по 8х и один на 4х. Разумеется, туда предполагалось совать всякие SCSI, Infiniband и прочие ненужные дома адаптеры. А вот видеокарта туда, как несложно заметить, не влезет. Дырка маловата.Первым делом я попробовал пойти по пути наименьшего сопротивления, обрезав пластик в задней части самого левого слота. Несмотря на то, что сам слот был помечен как 4-х скоростной, меня подкупало отсутствие за ним всевозможных деталей, которые могут затруднить установку платы.
К сожалению, система не заработала с видеокартой, сидящей в 4-х скоростном PCI-E разъеме. Мне удалось поставить Windows; CPU-Z совершенно правильно рапортовал о наличии 4х связи, однако после установки драйверов система намертво зависала (под ХР) и выпадала в синий экран под Вистой.
Как известно, для истинного овера нет непреодолимых преград, и необходимый инструмент неожиданно нашелся:
Издеваться над 8800GT, представленной на фотографии, мне поначалу как-то не хотелось. Мало ли что? Хотя и маловероятно.
Поэтому для надругательства была выбрана видавшая виды и вообще подаренная мне когда-то ради системы пассивного охлаждения GF7600GS.
Легким движением ножа эта видеокарта поменяла свой интерфейс с PCI-E 16x на PCI-E 8x:Не надо мне рассказывать про умельцев, умудрявшихся засунуть слотовые Пентиумы-2 в слот AGP! Я сам над такими хихикал.
А вот с картами PCI-Express спецификация позволяет проводить подобные издевательства. Не верите — курите техническую документацию!
Разумеется, после проведения "доработки напильником" видеокарта успешна поместилась в не предназначенный для видео слот:На получившееся в результате чудо науки и техники была установлена Виста х64. С драйвером 181.22.
И вот вам результат (скромный, не требуйте от 7600GS слишком многого):Воодушевленный полученным результатом, я пустил под нож гораздо более дорогую карту, 8800GT:
Полученный на штатных частотах результат в 11453 попугая можно считать вполне удовлетворительным, а аппарат — вполне достаточным для большинства игрушек.
Другие проблемы
Иногда при попытке удалённого управления сервером возникает ошибка “Login failed with an access denied error.”, причём в любых браузерах. Если перезагрузка сервера и клиента не помогает, то рекомендуется сбросить IMM до заводских настроек.
В статье про ошибки серверов HP мы упоминали о проблемах с системой охлаждения: сразу после запуска сервера вентиляторы выходили на высокие обороты и уже не снижали их. Случается такой недуг и в серверах IBM. Сервер воет, как реактивный лайнер на взлёте. Нам не удалось выяснить причину таких сбоев, но посоветовать можно следующее:
Занимаясь восстановленными (refurbished) серверами, мы накопили приличный опыт общения с проблемами разных брендов, которым хотим поделиться на примере машин большой тройки: Dell, HP и IBM. Чтобы никому не было обидно, мы пойдём в алфавитном порядке.
В этом посте мы собрали отзывы наших инженеров, которые имеют большой опыт в диагностировании, восстановлении и обслуживании серверов — каждая описанная ошибка решалась их потом и кровью. Эта информация не пригодится вам в случае, если вы обслуживаетесь по гарантии, но, тем не менее, может быть полезна.
Установка драйвера
Windows 10 автоматически установит драйвер на видеокарту, но этот драйвер будет не самой последней версии. Лучше всего использовать именно последний драйвер, который всегда можно скачать под ваше устройство с сайта производителя видеокарты NVIDIA или AMD.
После установки драйвера рекомендуется перезагрузить компьютер.
Читайте также: