1 dpc память что это
Подсистема оперативной памяти - важнейшая составляющая, от которой зависит производительность сервера и его эффективность. В иерархии хранения оперативная память стоит на втором месте после внутренних кэшей процессоров как по скорости, так и по стоимости хранения единицы информации.
Неэффективное ее использование существенно влияет на производительность, а значит – на отдачу от вложенных средств как на этапе покупки сервера, так и во время всего срока его эксплуатации.
Понятно, что подсистема оперативной памяти просчитывается еще на этапе принятия решения о покупке сервера. Но подчас загодя предсказать ее необходимый объем проблематично. К тому же, объем и состав программного обеспечения, устанавливаемый на сервер, может существенно измениться уже при вводе его в эксплуатацию, не говоря уже об изменениях во времени.
Ревизия и перестройка подсистемы должны проводиться регулярно, поскольку эти мероприятия позволят сохранять эффективность эксплуатации системы. Они могут потребоваться при изменении нагрузки на сервер в результате:
- изначальных ошибок в оценке необходимых ресурсов;
- повышения объема выполняемых компанией задач в результате роста;
- повышения требований к аппаратным ресурсам при обновлении установленного программного обеспечения;
- ввода новых инструментов, функций или расширении спектра услуг в компании
Свод правил
В системе должен быть установлен хотя бы один модуль DIMM . Даже в 2-процессорной системе.
Совместимость
- Все модули DIMMдолжны быть одного типа - DDR4 регистровые с коррекцией ошибок ECC
- Модули небуферизованной памяти (Unbuffered DIMM, UDIMM) не поддерживаются
- Смешивание RDIMM, LRDIMM, 3DS LRDIMM в одной системе недопустимо – они не совместимы между собой. Ни в одном канале, ни на одном процессоре, ни на разных процессорах – никак.
- Установка модулей разных производителей корректна. Важно – чтобы характеристики модулей были совместимы.
- RDIMMс организацией x4 и x8 несовместимы.
- Смешивание DIMM с разным количеством ранков в пределах одного канала допустимо
- Ограничение по числу логических ранков
- Процессоры Intel Xeon E5 v3, v4
- XeonE5 v3, v4 поддерживает до 8 ранков на канал, не превышайте это значение. Если необходима установка 3 модулей на канал (3DPC), модули должны быть 1- или 2-ранковыми.
- Поскольку LRDIMM буферизуется, четырехранковый LRDIMM представляется процессору как двухранковый DIMM - что позволяет устанавливать 3шт LRDIMM на канал не превышая ограничение по ранкам.
- Процессоры Xeon Scalable
- Так как процессоры Xeon Scalable позволяют устанавливать только до 2 модулей на канал, ограничение по ранкам для них снято.
Чипсеты Intel
Со стороны Intel производитель предлагает россыпь процессоров от начального до топового уровня — есть из чего выбирать. В качестве основы «синих» систем сейчас присутствует 2 поколения чипсетов и их возможности в плане разгона ЦП и памяти очень тривиальны. Официально Intel считает всего одну модель чипсета пригодной для разгона и это семейство Z 390/490. Все остальные проходят мимо.
Впрочем, из-за этого процесс выбора сведен к простому, казалось бы, выбору, но нет. С Z 390/490 все просто – определились с количеством интерфейсов, разъемов PCIe/USB и т.п. Нашли подходящую материнскую плату и купили. Зашли в BIOS или программу для разгона и попали в новый таинственный мир удивительных открытий. Если разгон не нужен, то покупаем любую подходящую плату. А с третьим вариантом притормозим. Хотя компания Intel официально и не признает разгон памяти на любых версиях чипсета за исключением двух ранее упоминавшихся, но производители стараются открыть пользователям скрытые возможности. В зависимости от модели могут быть доступны настройки (базовые или расширенные) таймингов памяти и делители (только ниже частоты, указанной в спецификации Intel для выбранного процессора). Например, некоторые удачные версии плат на чипсете B460/H470 все же наделены опциями по тонкой настройке таймингов памяти и форсировании режимов Turbo на процессорах, так называемая фиксация PL режимов (перевод работы процессора в постоянно поддержание турбо частоты).
Смешивание модулей с разными характеристиками в одной системе
Какие-то параметры модулей DIMM позволяют смешивать их в одной системе / канале памяти, какие-то - жестко нет.
Например, установка модулей одного типа с разной тактовой частотой допустимо, но при этом все модули будут работать на частоте самого медленного.
Корректное расположение модулей одного типа разной емкости не приведет к снижению производительности
Сочетание модулей с различным количеством ранков при правильной их установке допустимо
Для платформы Intel
Не всегда память может стартовать с готовых настроек XMP, особенно высокочастотная. Поэтому сначала начните с применения профиля XMP, но на частоте 3200 МГц. В BIOS обязательно убираем MRC Fast boot. Запишите основные тайминги и откройте программу тайфун, чтобы узнать, с какими чипами имеете дело. Запустите TestMem5 и сделайте непродолжительный тест. Для уменьшения времени грубой настройки не ждите часами, при стабильности в несколько минут можно идти и снижать тайминги. Снижайте и изменяйте их по одному, выискивая нестабильные показатели. Обязательно записывайте значения, какие тайминги были нестабильными. Не пытайтесь выставить предельно низкие тайминги или высокую частоту памяти сразу. С двумя модулями и высокой частотой (более 4 ГГц) CR выставить на 2, если стоит 1. С 4 модулями сразу можно начинать тест на значении CR 2. Изменения таймингов лучше начать с CL и RCD. Многие чипы не «любят» синхронных значений, для них CL всегда будет меньше, чем RCD. RAS сразу пробуйте по формуле RCD+CL+4, до этого значения от него существенная разница, дальше влияние исчезает. CWL=RRD_S, CKE=5, СCDL>=4.
RDRD_DD и похожие значения требуют внимания при использовании всех 4 слотов Dimm. Значение определять опытным путем и тестированием. Это тонкие настройки для стабилизации работы всех 4 планок.
RDWR_SG(DG) и похожие пункты меню в BIOS опускайте до минимальных, но рабочих значений. Для стабильности сделайте +2 к ним.RFC настраивать можно в самом конце. Его не нужно понижать или повышать сверх меры, просто найдите число в стабильном диапазоне, который обычно бывает от +20 до +40 пунктов от базового.
REFi требует подгонки с тестированием и стандартно проявляет себя по принципу больше — лучше. Находится в зависимости от значения RFC. Последнее описывает статус времени отдыха памяти, а первый – работы.
Тестируйте тщательно, в том числе на холодную и с перезагрузками.
• Asrock Timing Configurator 4.0.4 – просмотр таймингов;
• Asus MemTweakIt 2.02.44 — просмотр таймингов;
• TestMem5 — тест памяти на стабильность и ошибки;Промежуточный итог
Вкратце, для материнских плат с разводкой:
Daisy chain — лучший вариант для разгона 2 модулей памяти с одноранговой организацией, чуть хуже планки с двумя рангами. Следующая комбинация, состоящая из 4 Dimm с одним рангом, а далее с двумя рангами.
Для T-topology — для разгона подходят 4 модуля памяти с одноранговой организацией, но можно устанавливать 2 модуля с двумя рангами. Совсем неподходящая комбинация 2 или 4 модуля с двумя рангами.
По уровню разгона согласно мировой статистике: 8 Гб B-die > 8 Гб Micron Rev. E > 8 Гб CJR > 4 Гб E-die > 8 Гб AFR > 4 Гб D-die > 8 Гб MFR > 4 Гб S-die.
Топология
Для DDR4 обычно используют два вида разводки слотов — Daisy chain и T-topology.
T-Topology обладают редкие экземпляры материнских плат и приспособлены для лучшего разгона 4 модулей памяти. T-Topology разводка позволяет достичь частот более 4 ГГц сразу на 4 планках Dram, в то время как Daisy chain с 2 модулями добирается в руках пользователей до частоты более 4,5 ГГц.
Daisy chain – разводка оптимизирована для 2 модулей памяти. При условии удачного процессора и хорошо разгоняемой памяти лучше выбирать такие платы с 2 занятыми слотами Dimm. Второй вариант разводки косвенно можно отличить по рекомендациям производителей устанавливать память сначала в последние слоты, которые являются своего рода первыми в очереди в логической цепочке ответвлений от контроллера памяти.
Ранги
С топологиями разводки каналов разобрались, переходим к рангам памяти…
Ранг памяти — это блок или область данных, которые создаются с использованием нескольких или всех микросхем памяти в модуле. Ранг — это блок данных шириной 64 бита. Не стоит путать ранги с расположением микросхем памяти на текстолите. Результаты разгона памяти с двумя рангами довольно печальные, контроллеру памяти и шине тяжело справлять с четырьмя рангами. Максимум, что доступно — от 3466 МГц при CL14 до 3600 МГц при CL16. Единственный плюс от четырех рангов — это внушительный объем оперативной памяти и технология чередования рангами, которая увеличит производительность системы в играх. Узнать о количестве рангов можно из расшифровки модулей на сайте производителя, либо через утилиты Thaiphoon/Aida64/ CPU-Z.
В программе Thaiphoon легко определить производителя микросхем, организацию модуля памяти, ранговость и остальные параметры.
• Manufacturer – производитель микросхем;
• Die Density / Count – Емкость одной микросхемы в Гбитах и кодовое название. Его обычно используют в профильных форумах для ориентации среди различных версий микросхем. Обычно говорят Samsung B-die, либо Micron E-die;
• Composition – организация банков в одной микросхеме памяти (2048 Мбит*8=16 Гбит);
• Capacity – емкость всего модуля памяти, в скобках указано количество микросхем;
• Organization – в этом поле можно точно узнать ранговость вашей памяти (1/2 ranks);Постепенно, начиная с конца 2019 года, Kingston переходит на использование 16 Гбит чипов памяти. Поэтому емкие комплекты Dram организуются из 16 Гбит микросхем с одноранговой адресацией, емкостью 16 ГБ и двухранговой 32 ГБ.
Чипсеты AMD
Легко выбрать, сложно разогнать! С платформой AMD AM4 все с одной стороны просто в вопросе выбора чипсета, а с другой — во много раз сложнее. Любой современный чипсет AMD поддерживает разгон памяти и процессора, даже сверхбюджетный A520. Другое дело, что некоторые производители материнских плат урезают в BIOS нужны пункты меню, например, редактор PBO режимов. Но в целом, начиная с B450 разгон возможен в полной мере.Тип модулей
Тип модулей DIMM , поддерживаемых системой, жестко определяется типом установленных в сервер процессоров и описан в инструкции по эксплуатации или на сайте производителя. Это касается как собственно типа – DDR 3, DDR 4, буферизации модулей - буферизованная, регистровая, и системы исправления ошибок – ECC
Отдельный класс модулей памяти – LR DIMM , 3DS LRDIMM. Это модули повышенной емкости с оптимизированной за счет внутренних регистров нагрузкой на шину памяти. Так как внутренняя структура модулей этого типа существенно отличается от обычной RDIMM, одновременная установка DIMM разного типа в системе невозможна. Ни в каких сочетаниях.
Тонкости контроллера памяти и разводки плат
Если бы в компьютерном мире все было бы просто, то жить было бы легче! Увы, или к счастью, это не так. Помимо загрузки вашей головы типами чипсетов для разгона памяти важны и другие характеристики комплектующих. Начать стоит со второй составляющей и это контроллер памяти в процессоре. На последних 5 поколениях этот аппаратный блок напрямую связан с System Agent в ЦП и с шиной. Объективно, несмотря на постоянство в выборе тех. процесса (14 нм и различные улучшения +, ++, +++) компания постоянно улучшает их способности держать более высокие частоты без запредельно высоких напряжений. Вспоминая разгон памяти на процессорах от Kaby Lake до Comet Lake, нельзя отрицать тот факт, что процесс упростился, а финальные частоты выросли. Не последнюю очередь это связано с более тщательным подходом написания таблиц таймингов и субтаймингов в XMP комплектов памяти. Это серьезно упрощает алгоритм материнской платы по первоначально загрузке, хотя некоторые производители вносят либо слишком короткий список таймингов, забывая о вторичных/третичных, либо сильно повышают напряжение на контроллер памяти и системный агент. Такие действия приводят систему в нестабильное состояние, а часто повышенное напряжение перегревает процессор. Поэтому стоит внимательно подходить к выбору комплекта памяти. А помимо ранее озвученных составляющих разгона Dram чуть не упустили из виду правильность разводки слотов.
Ранки
Данные по шине памяти передаются в единицах из 64 бит для всех типов DIMM. Это особенность технологии памяти DDR-SDRAM. Область памяти этой ширины трансформируется на группу чипов DRAM внутри DIMM - каждый отдельный чип отвечает за выдачу или 4 или 8 бит (обозначается как x4 или x8 в кодировке чипа). Такая группа чипов называется ранком. Существуют DIMM с 1, 2 или 4 ранками. DIMM максимальной емкостм - это модули с 4 ранками, но спецификация DDR4 допускает только 8 ранков на канал памяти. Процессор может организовать чередование по ранкам наряду с чередованием по каналам, контроллерам и т.д. (*)
Структуры x4 или x8 модулей DIMM по-разному задействованы в системе обнаружения и исправления ошибок памяти ECC. Именно по этой причине RDIMM типа x4 нельзя смешивать с RDIMM типа x8.
Тактовая частота шины
Тактовая частота модулей памяти DIMM должна соответствовать максимальной частоте шины, поддерживаемой встроенным в процессор контроллером памяти – то есть, тоже определяется используемым процессором.
В серии Xeon E 5 младший процессор Xeon E 5 v 4 – E 5-2609 v 4 поддерживает частоты шины 1600/1866 МГц, средний E 5-2630 v 4 - 1600/1866/2133 МГц, а более старшие, например E 5-2650 v 4 - 1600/1866/2133/2400 МГц
В серии Xeon Scalable : Bronze 3104 и 3106 поддерживает частоту 2133 МГц, Silver 4108 и 4110 - 2400 МГц, Gold 6130 – 2666 МГц.
В конфигурациях 2 модуля на канал (2 DPC ) и 3 модуля на канал (3 DPC ) серверов на процессорах Xeon E 5 с каждым добавлением DIMM в канал, на ступень уменьшается частота шины. Соответственно, если в канале процессора, поддерживающего шину 2400 МГц установлен 1 DIMM , он работает на полной частоте. Добавляем модуль в тот же канал – они работают на частоте 2133 МГц. Добавляем третий – канал настраивается на частоту 1866 МГц
Процессоры Xeon Scalable позволяют устанавливать до двух модулей DIMM на канал, снижения частоты шины при этом не происходит.
Модули DIMM с частотой большей, чем тактовая частота шины, установленная процессором, могут корректно работать в системе, но не наоборот.
О памяти для AMD
Теперь вы ознакомлены с нюансами работы контроллера памяти, шины IF и L3-кеша, а что же с выбором материнской платы. Как и ранее упомянутые топологии (Daisy chain и «Т»), для процессоров AMD производители выпускают оба типа плат с большим перевесом в сторону Daisy chain. Поэтому оптимальные рекомендации по памяти выглядят следующим образом:
Покупка одноранговой памяти в количестве 2 штук максимального объема для максимального разгона. Чипсет не важен, будь то B550 или Х470/570. Этот совет распространяется на 90% любых конфигураций с процессорами AMD. Совсем неоднозначные результаты разгона достигаются на двухранговых модулях памяти. В промежутке стоит комплект с четырьмя одноранговыми модулями. Завершает парад система с четырьмя двуранговыми планками памяти. Как определить топологию материнской платы под AMD? Спасибо, интернету, все за нас определено. Достаточно пройти по ссылке и найти интересующую материнскую плату.
Вернемся к подбору памяти исходя из топологии купленной материнской платы. Конечно, установив память в систему и запустив программу, мы со 100% уверенностью скажем, сколько рангов в нашей памяти. Но есть инструмент и проще, без покупки «кота в мешке». Заходим на страницу памяти, выбираем интересующие нас параметры (тайминги, цвет, объем, подсветку) и смотрим в описание. Для примера рассмотрим два комплекта Fury X объемом 32 Гб и 64 Гб.
64 ГБ комплект HyperX FURY DDR4 RGB, состоящий всего из 2 модулей создан в двухранговой конфигурации. Об этом нам сообщает надпись 2Rx8.
В случае с аналогичным комплектом, но объемом 32 ГБ организация планок превращается в одноранговый тип (1R). Вот такой простой способ определении рангов, используемых в памяти.Напряжение питания
Напряжение питания модулей DIMM задано в описании системы/материнской платы. Для современных модулей обычно составляет 1,2 В.
Выводы
Разгон памяти – это хождение по минному полю без металлодетектора, основываясь только на собственной обостренном чутье. Чтобы сократить число минут, процесс стоит начинать с выбора правильной материнской платы, подходящего комплекта памяти и опыта других людей. Коллективный разум и десятки тысяч часов, проведенных в поисках оптимальных комбинаций настроек и параметров, плавно заполонили FAQ. Допустим, вы прекрасно понимаете, какие комплекты памяти подходят для daisy chain или Т-топологии материнских плат. Отличаете 1 и 2 ранговую память. Научились определять производителя микросхем, но немаловажно будет отметить существование QVL листов совместимости у производителей материнских плат. Однако, не найдя требуемого комплекта памяти, не расстраиваетесь. Опыт, ошибки, внимательность позволят вам через n-ное число часов найти те самые настройки, при которых и 2 различных комплекта Kingston (2 ранговых) общим объемом в 96 ГБ будут стабильно работать в неподходящей материнской плате.
Для получения дополнительной информации о продуктах Kingston Technology обращайтесь на официальный сайт компании.
В продолжение рубрики "конспект админа" хотелось бы разобраться в нюансах технологий ОЗУ современного железа: в регистровой памяти, рангах, банках памяти и прочем. Подробнее коснемся надежности хранения данных в памяти и тех технологий, которые несчетное число раз на дню избавляют администраторов от печалей BSOD.
Сегодня на рынке представлены, в основном, модули с памятью DDR SDRAM: DDR2, DDR3, DDR4. Разные поколения отличаются между собой рядом характеристик – в целом, каждое следующее поколение "быстрее, выше, сильнее", а для любознательных вот табличка:
Для подбора правильной памяти больший интерес представляют сами модули:
RDIMM — регистровая (буферизованная) память. Удобна для установки большого объема оперативной памяти по сравнению с небуферизованными модулями. Из минусов – более низкая производительность;
UDIMM (unregistered DRAM) — нерегистровая или небуферизованная память — это оперативная память, которая не содержит никаких буферов или регистров;
LRDIMM — эти модули обеспечивают более высокие скорости при большей емкости по сравнению с двухранговыми или четырехранговыми модулями RDIMM, за счёт использования дополнительных микросхем буфера памяти;
HDIMM (HyperCloud DIMM, HCDIMM) — модули с виртуальными рангами, которые имеют большую плотность и обеспечивают более высокую скорость работы. Например, 4 физических ранга в таких модулях могут быть представлены для контроллера как 2 виртуальных;
Попытка одновременно использовать эти типы может вызвать самые разные печальные последствия, вплоть до порчи материнской платы или самой памяти. Но возможно использование одного типа модулей с разными характеристиками, так как они обратно совместимы по тактовой частоте. Правда, итоговая частота работы подсистемы памяти будет ограничена возможностями самого медленного модуля или контроллера памяти.
Для всех типов памяти SDRAM есть общий набор базовых характеристик, влияющий на объем и производительность:
частота и режим работы;
Конечно, отличий на самом деле больше, но для сборки правильно работающей системы можно ограничиться этими.
Понятно, что чем выше частота — тем выше общая производительность памяти. Но память все равно не будет работать быстрее, чем ей позволяет контроллер на материнской плате. Кроме того, все современные модули умеют работать в в многоканальном режиме, который увеличивает общую производительность до четырех раз.
Режимы работы можно условно разделить на четыре группы:
Single Mode — одноканальный или ассиметричный. Включается, когда в системе установлен только один модуль памяти или все модули отличаются друг от друга. Фактически, означает отсутствие многоканального доступа;
Dual Mode — двухканальный или симметричный. Слоты памяти группируются по каналам, в каждом из которых устанавливается одинаковый объем памяти. Это позволяет увеличить скорость работы на 5-10 % в играх, и до 70 % в тяжелых графических приложениях. Модули памяти необходимо устанавливать парами на разные каналы. Производители материнских плат обычно выделяют парные слоты одним цветом;
Для максимального быстродействия лучше устанавливать одинаковые модули с максимально возможной для системы частотой. При этом используйте установку парами или группами — в зависимости от доступного многоканального режима работы.
Ранг (rank) — область памяти из нескольких чипов памяти в 64 бита (72 бита при наличии ECC, о чем поговорим позже). В зависимости от конструкции модуль может содержать один, два или четыре ранга.
Узнать этот параметр можно из маркировки на модуле памяти. Например уKingston число рангов легко вычислить по одной из трех букв в середине маркировки: S (Single — одногоранговая), D (Dual — двухранговая), Q (Quad — четырехранговая).
Пример полной расшифровки маркировки на модулях Kingston:
Серверные материнские платы ограничены суммарным числом рангов памяти, с которыми могут работать. Например, если максимально может быть установлено восемь рангов при уже установленных четырех двухранговых модулях, то в свободные слоты память добавить не получится.
Перед покупкой модулей есть смысл уточнить, какие типы памяти поддерживает процессор сервера. Например, Xeon E5/E5 v2 поддерживают одно-, двух- и четырехранговые регистровые модули DIMM (RDIMM), LRDIMM и не буферизированные ECC DIMM (ECC UDIMM) DDR3. А процессоры Xeon E5 v3 поддерживают одно- и двухранговые регистровые модули DIMM, а также LRDIMM DDR4.
Тайминги или латентность памяти (CAS Latency, CL) — величина задержки в тактах от поступления команды до ее исполнения. Числа таймингов указывают параметры следующих операций:
CL (CAS Latency) – время, которое проходит между запросом процессора некоторых данных из памяти и моментом выдачи этих данных памятью;
tRCD (задержка от RAS до CAS) – время, которое должно пройти с момента обращения к строке матрицы (RAS) до обращения к столбцу матрицы (CAS) с нужными данными;
tRP (RAS Precharge) – интервал от закрытия доступа к одной строке матрицы, и до начала доступа к другой;
tRAS – пауза для возврата памяти в состояние ожидания следующего запроса;
Разумеется, чем меньше тайминги – тем лучше для скорости. Но за низкую латентность придется заплатить тактовой частотой: чем ниже тайминги, тем меньше допустимая для памяти тактовая частота. Поэтому правильным выбором будет "золотая середина".
Существуют и специальные более дорогие модули с пометкой "Low Latency", которые могут работать на более высокой частоте при низких таймингах. При расширении памяти желательно подбирать модули с таймингами, аналогичными уже установленным.
Для коррекции нерегулярных ошибок применяется ECC-память, которая содержит дополнительную микросхему для обнаружения и исправления ошибок в отдельных битах.
Метод коррекции ошибок работает следующим образом:
При записи 64 бит данных в ячейку памяти происходит подсчет контрольной суммы, составляющей 8 бит.
Когда процессор считывает данные, то выполняется расчет контрольной суммы полученных данных и сравнение с исходным значением. Если суммы не совпадают – это ошибка.
Технология Advanced ECC способна исправлять многобитовые ошибки в одной микросхеме, и с ней возможно восстановление данных даже при отказе всего модуля DRAM.
Исправление ошибок нужно отдельно включить в BIOS
Большинство серверных модулей памяти являются регистровыми (буферизованными) – они содержат регистры контроля передачи данных.
Регистры также позволяют устанавливать большие объемы памяти, но из-за них образуются дополнительные задержки в работе. Дело в том, что каждое чтение и запись буферизуются в регистре на один такт, прежде чем попадут с шины памяти в чип DRAM, поэтому регистровая память оказывается медленнее не регистровой на один такт.
Все регистровые модули и память с полной буферизацией также поддерживают ECC, а вот обратное не всегда справедливо. Из соображений надежности для сервера лучше использовать регистровую память.
Для правильной и быстрой работы нескольких процессоров, нужно каждому из них выделить свой банк памяти для доступа "напрямую". Об организации этих банков в конкретном сервере лучше почитать в документации, но общее правило такое: память распределяем между банками поровну и в каждый ставим модули одного типа.
Если пришлось поставить в сервер модули с меньшей частотой, чем требуется материнской плате – нужно включить в BIOS дополнительные циклы ожидания при работе процессора с памятью.
Для автоматического учета всех правил и рекомендаций по установке модулей можно использовать специальные утилиты от вендора. Например, у HP есть Online DDR4 (DDR3) Memory Configuration Tool.
Вместо пространственного заключения приведу общие рекомендации по выбору памяти:
Для многопроцессорных серверов HP рекомендуется использовать только регистровую память c функцией коррекции ошибок (ECC RDIMM), а для однопроцессорных — небуферизированную с ECC (UDIMM). Планки UDIMM для серверов HP лучше выбирать от этого же производителя, чтобы избежать самопроизвольных перезагрузок.
В случае с RDIMM лучше выбирать одно- и двухранговые модули (1rx4, 2rx4). Для оптимальной производительности используйте двухранговые модули памяти в конфигурациях 1 или 2 DIMM на канал. Создание конфигурации из 3 DIMM с установкой модулей в третий банк памяти значительно снижает производительность.
Список короткий, но здесь все самое необходимое и наименее очевидное. Конечно же, старый как мир принцип RTFM никто не отменял.
Объем оперативной памяти
Сверху объем оперативной памяти сервера ограничен количеством слотов DIMM в системе и максимальным объемом одного модуля того типа, который поддерживается процессорами системы. Снизу – только финансовыми возможностями компании.
В идеале – общий объем оперативной памяти при штатной загрузке системы не должен быть занят более, чем на 75%. Отдельные пики загрузки, если они непродолжительны, не существенно повлияют на производительность. Низкая загруженность системы говорит о неэффективно вложенных средствах. А полная занятость оперативной памяти приводит к процессам вытеснения задач ( swap ), связанных с переносом части данных из оперативной памяти в дисковую и обратно за счет файлов подкачки – что кардинально снижает производительность сервера.Уровень занятости физической оперативной памяти можно проверить различными встроенными в операционную систему мониторами производительности. Важно! Рассматривать необходимо именно физическую память, без учета файлов подкачки
Почему же разгон на AMD сложнее и требует некоторого объема знаний?
Из-за использования специальной шины Infinity Fabric, которая связывает между собой отдельные блоки в процессоре, именуемые CCX. Infinity Fabric имеет свой собственный тактовый домен, который синхронизируется с физической частотой памяти. Начиная со второго поколения Zen получил дополнительный режим, когда частота IF принимает значение частоты памяти, а также 1/2 MEMCLK, который существенно увеличит частотный потенциал DRAM во время разгона. Идеальным режимом работы IF для максимальной производительности все еще остается соотношение 1:1. Не будем вдаваться в подробности, но для игр соотношение работы памяти и IF 1 к 1 дает несколько вариантов оптимальных частот – это 3600, 3800 МГц. В зависимости от удачи, если вам попадется счастливый билет вытянуть процессор со стабильно функционирующим IF в 4 ГГц, то можем вас поздравить, вы уникальный человек.
Разумным выбором для процессоров Ryzen 3ххх было и остается использование модулей памяти DDR4-3600 или DDR4-3733. Предельная частота шины Infinity Fabric составляла 1800-1867 МГц. Далее переключался делитель, который позволял разгоняться памяти выше, но дивидендов система не получала. Все это касается и новых Ryzen 5xxx серии. Происходит это потому, что вместе с IF синхронно увеличивается частота L3-кеша, тем самым поднимая пропускную способность внутри процессора.
О контроллере
Zen 2/3 поколения Ryzen оснащаются контроллером памяти, ведущий свою родословную со времен Bulldozer. Конечно, в него внесены изменения для DDR4, но контроллер построен на все том же 12-нм техпроцессе. В Zen 3 он не претерпел никаких изменений, однако благодаря новой компоновке ядер Zen 3 лишился одной промежуточной шины IF, что положительно сказалось на времени доступа к ОЗУ.
Программы, таблицы, алгоритмы помогающие разгонять память
Производительность
- Последовательно заполняйте банки памяти без пропусков.
- Распределение по каналам памяти.
- Процессоры Intel Xeon E5 v3, v4. Процессоры Xeon E5 нижнего диапазона - процессоры Intel Xeon E5 v3 с менее чем 10 ядрами и процессоры E5 v4 с менее чем 12 ядрами имеют только один контроллер памяти. В них все четыре канала памяти подключены к одному контроллеру. В более производительных процессорах встроено два контроллера памяти, каждый из которых управляет двумя каналами.
- Старайтесь распределить модули памяти так, чтобы задействовать все каналы памяти процессора (4). Каждый канал дает 25% общей полосы пропускания подсистемы памяти. При этом, избегайте несбалансированных конфигураций. (*)
- Процессоры Xeon Scalable. Процессоры Xeon Scalable имеют 2 встроенных контроллера памяти, каждый из них управляет 3 каналами (всего 6).
- Старайтесь распределить модули памяти так, чтобы задействовать все каналы памяти процессора Scalable (6). При этом, избегайте несбалансированных конфигураций. (*)
- Процессоры Intel Xeon E5 v3, v4
- Для получения максимальной производительности, устанавливайте память в сервер наборами по 4 идентичных модуля на один процессор– таким образом в полной мере будут задействованы все каналы памяти и максимально эффективно использовано чередование. (*)
- Процессоры Xeon Scalable
- Для получения максимальной производительности, устанавливайте память в сервер наборами по 6 идентичных модулей на один процессор– таким образом в полной мере будут задействованы все каналы памяти и максимально эффективно использовано чередование. (*)
(*) Про балансировку и чередование памяти в системах с различными процессорами читайте следующие статьи :
В видеокартах NVIDIA GTX 10-х серий GTX 1060, GTX 1070, GTX 1080 существует, и по сей день нерешенная компанией NVIDIA серьезная проблема высоких задержек DPC. Которая приводит к фризам, зависаниям в играх, даже при работе системы без больших нагрузок. В статье приводится метод решения этой проблемы.
До сих пор еще, очень много пользователей имеют в своих компьютерах видеокарты Nvidia 10-ой серии GTX 1060, GTX 1070, GTX 1080. Их владельцы по причине массового безумства, называемого майнингом, так и не смогли их поменять на видеокарты 20 и 30 серии по известным причинам. Потому данная серия видеокарт на сегодняшний день является актуальной для пользователей. И я не являюсь исключением, у меня есть компьютер с видеокартой PALIT JETSTREAM GTX 1070.
реклама
Майнинг нас всех вынудил сделать шаг назад по поколениям комплектующих. В начале 2020 года я думал, что моя видеокарта доживает уже последние дни своей актуальности. А сейчас понимаю, что она полностью актуальна на сегодняшний день, в связи со сложившейся ситуацией на рынке видеокарт.
В этой статье хочу поделиться с читателями о том, как компания NVIDIA в очередной раз «села в лужу» с видеокартами 10-й серии, причем конкретно так села, и до сих пор так и не смогла устранить имеющиеся с ними проблемы. Видеокарты Nvidia 10 серии прославились фризами и подвисаниями в играх, несмотря на высокие значения FPS при этом. Разбираться с этим вопросом я стал после того, как сам столкнулся с такими проблемами на своей видеокарте GTX 1070. Причем изменение настроек в любых их вариантах проблему не решило, фризы никуда не исчезли. Единственная настройка в драйвере видеокарты (в панели управления NVIDIA), которая хотя бы несколько уменьшила фризы, это включение на «ультра» режима низкой задержки.
И да, лучше бы у меня была видеокарта AMD RX 580 8 Gb, в каком ни будь ее топовом исполнении. У них подобных проблем не наблюдалось. При попытке выяснить причину этих фризов при помощи технических форумов, я увидел, что эта проблема высоких задержек видеокарт 10-й серии носит массовый характер, причем еще с момента выхода видеокарт этой серии в народные массы, и имеет название «High DPC Latency on Pascal GPUs». Проблема эта возникает из-за неправильной работы системных таймеров прерываний в драйвере, или из-за заложенных ошибок в GPU «Pascal». До сих пор, так окончательно и не выяснено, является ли это проблемой железа, которая была заложена в него на стадии проектирования архитектуры GPU «Pascal», или все же это программный дефект. Но судя по результату жалоб пользователей, и по частичному признанию компанией NVIDIA этой проблемы, и ее неудачными попытками решить эту проблему программным методом, путем выпуска драйверов, начиная с версии 386.95 и последующих версий с хост-фиксом (горячее исправление), можно сделать вывод, что все, же это проблема железа.
реклама
Ответ компании NVIDIA, что проблема решена..
реклама
Последующая жалоба в компанию NVIDIA о нерешенной проблеме.
Никакие программные ухищрения к устранению данной проблемы не привели. А драйвера начиная с версии 386.95 с хост-фиксом, это такая себе полумера, для отвода глаз, которая проблему окончательно так и не решила, и после выпуска этого драйвера жалобы так и не прекратились. У меня вообще сложилось впечатление, что компания NVIDIA специально, осознанно «завалила» этот параметр задержек, чтобы за счет его ухудшения улучшить другие, по которым оценивается производительность в синтетических тестах, таким образом, для значительного повышения FPS они и создали эту неправильную работу системных таймеров прерываний. И получается, что в тестах все прекрасно, а играть невозможно.
Данную проблему еще усугубляет «количество подготовленных кадров», опция этого параметра так же находится в панели управления NVIDIA. Подготовленные кадры, так сказать кадры, хранящиеся в запасе, необходимы для того, чтобы поступление их на рендеринг в видеокарту от центрального процессора было непрерывным, даже если центральный процессор «затупит», и не успеет подготовить очередной кадр в срок по какой-либо причине. Эта функция не позволяет видеокарте простаивать в момент отсутствия очередного кадра от центрального процессора, кадр берется из запаса. Так же эта функция повышает FPS (количество кадров в секунду), но она значительно увеличивает задержки DPC, и для уменьшения задержек необходимо эту функцию отключить, или свести к минимуму количество подготовленных кадров.
Приведу для примера измерение задержек в своем компьютере с помощью программы «LatencyMon». Она в режиме реального времени проводит измерение задержек, и в случае превышения задержек, в скобках указывает виновника.
реклама
В первом случае отключаю драйвер видеокарты NVIDIA путем отключения устройства «NVIDIA GeForce GTX 1070» в диспетчере устройств, видеокарта в этом случае будет работать без драйвера, и провожу измерение задержек.
И по результату измерений видно, что программа «LatencyMon» ничего касающегося видеокарты, как виновника больших задержек не указала. А указала сетевой драйвер (network driver interface specification).
Теперь включаю драйвер видеокарты NVIDIA путем включения устройства «NVIDIA GeForce GTX 1070» в диспетчере устройств, и провожу повторно измерение.
И теперь видно, что программа «LatencyMon» указала виновника в больших задержках, которые составляют 551 мкс. И это драйвер видеокарты NVIDIA версии 465.89.
Что бы хотелось посоветовать для уменьшения эффекта фризов в видеокартах NVIDIA GTX 10-х серий:
1. В настройках панели управления NVIDIA, в режиме управления электропитанием установить режим максимальной производительности.
2. В настройках панели управления NVIDIA, режим низкой задержки обязательно включить на «ультра».
3. В настройках панели управления NVIDIA, максимальное количество заранее подготовленных кадров установить на минимум.
Сталкивались ли вы с такой проблемой в видеокартах NVIDIA GTX 10-х серий? И как вы их решили? Пишите в комментариях.
Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Совсем недавно вышла память нового стандарта - DDR5. Большинство сразу обратило внимание, что её тайминги имеют достаточно большую величину, выраженную в нескольких десятках двухзначных чисел. В данной статье я попробую сравнить тайминги DDR с первого по пятое поколение, а заодно и рост тактовых частот.
Начну с первого поколения DDR, которое появилось ровно 20 лет назад в 2001 году. Как первое поколение Double Data Rate памяти, её частоты понемногу росли год от года. И к 400 МГц или спецификации DDR400 (PC-3200) первое поколение этого типа памяти можно считать, что созрело.
реклама
DDR1 использовалась с Pentium 4, c Athlon XP и даже Athlon 64 первой волны, которые устанавливались в Socket 754 и 939. Были, естественно, и оверклокерские модули памяти с частотой, превышающей 400 МГц. Память, под конец своего развития, доросла до 600 и в отдельных случаях до 700 МГц.
Нормальными и быстрыми таймингами считались цифры 2-2-2-5 на 400 МГц. Память чуть похуже или золотая середина работала с таймингами 2.5-3-3-5, а вся остальная или медленная на всех тройках: 3-3-3-6. Я нашел в интернете несколько скриншотов работы скоростной памяти на частоте 500 и 700 МГц. Посмотрите на её латентность.
реклама
На 500 МГц с таймингами 1.5-2-2-5 имеем 37.3 нс, на 700 МГц с таймингами 3-5-4-5 латентность уже составляет - 56 нс. Для 700 МГц набора от Patriot тайминги по SPD равнялись 3-5-5-9.
С 2004 года начала появляться память второго поколения. За пару лет она достигла своих зрелых частот и её стандартной и эффективной частотой работы можно назвать 800 МГц. Конечно, как и с DDR1 производители скоростных комплектов не сидели сложа руки, появились наборы, работающие на 1066 МГц, 1200 и даже 1300 МГц. Скоростные модули памяти на 800 МГц работали с таймингами 4-4-4-12, а подавляющее большинство уже на всех пятерках 5-5-5-18. Третий сорт довольствовался шестерками соответственно.
реклама
На 800 МГц при таймингах 5-5-5-18 латентность составляет 82.5 нс, но в некоторых случаях она доходила до 90 и даже 100 нс. На 1000 МГц ситуация несколько улучшалась и можно было надеяться на цифры менее 70 нс.
В 2008 году появились первые планки памяти стандарта DDR3. Сначала их примерили процессоры на Intel Socket 775, а затем и AMD AM3. Стартовало третье поколение DDR памяти с 800 МГц, хотя более распространенными были 1066 и 1333 МГц планки. Для таких частот нормальными таймингами считались 9-9-9-24.
реклама
Sandy Bridge вернул латентность в прежнее русло и она стала меньше 50 нс. Потом появились Ivy Bridge, Haswell, где частота выросла до 2800, 3000 и в отдельных случаях до 3200 МГц. Для таких частот тайминги подросли до значений 12-12-12.
На 2600 МГц память стандарта DDR3 с таймингами 11-12-11-32 демонстрирует латентность порядка 40.6 нс.
С 2014 года началось шествие нового стандарта оперативной памяти четвертого поколения. В этот раз начало новому стандарту дала не мейнстрим платформа, а HEDT Socket 2011 от Intel. Раскачиваться DDR4 начала с отметки 2133 МГц, хотя сразу же был доступен и вариант с 2400 МГц. Тайминги памяти подросли до 15-15-15-36.
Латентность в таких условиях равнялась 60 наносекундам. Далее память медленно, но верно покорила отметку в 3 ГГц, и продолжила дальнейший рост.
А спустя год, цифры порядка четырех гигагерц стали уже нормой. Вариант выборов таймингов в это время стал очень обширным. Все благодаря микросхемам памяти производства Samsung. Память на одной и той же частоте могла работать как с таймингами 16-16-16, так и 20-20-20.
На скриншоте выше показан очень хороший результат работы оперативной памяти стандарта DDR4 на частоте 4 ГГц с таймингами 16-16-16, латентность при этом составляет 36,2 нс. Рост частот продолжился и далее, благодаря компании Hynix появились модули памяти с частотой 5000 и 5333 МГц. Тайминги на такой частоте уже подросли до 20-24 по Cas Latency.
И вот буквально несколько дней назад мы все стали свидетелями появления нового стандарта памяти – DDR5, который принесли нам процессоры Intel Alder lake для Socket LGA1700. Память нового стандарта стартовала с отметки 4800 МГц с таймингами 40-40-40.
С заниженными до минимальных значений 36-36-36 на 4800 МГц DDR5 демонстрирует латентность порядка 86.3 нс, что конечно же многовато.
На 6400 МГц с таймингами 40-40-40 латентность увеличивается до 92.5 нс. Подводя итог можно сказать, что DDR5 еще только в начале своего пути и пока сыровата. Должна пройти пара лет, и мы увидим привычные нам цифры латентности менее 50 нс, а может и не увидим, смотря в какую сторону пойдет прогресс и развитие.
Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Разгон памяти, дело добровольное. Как понять, от чего зависит разгон памяти, какие есть тонкости в подборе комплектующих и как «прогнать» память, чтобы было за нее не стыдно!
Изучение, анализ и подбор – три составляющих успеха в разгоне памяти. Чтобы начать разгонять память без погружения в пучины технических знаний, необязательно быть специалистом. Половина успеха зависит от платформы, вторая часть – это правильный выбор ранговости, количество модулей и частот памяти Kingston и HyperX.
Основные характеристики подсистемы памяти.
Ряд характеристик необходимо учитывать как при проектировании будущего сервера, так и при его перестройке – апгрейде или восстановлении (ремонте).
Для платформы AMD
Открываем программу тайфун и смотрим, какие используются чипы памяти. Далее запускаем калькулятор DRAM Calculator for Ryzen и выбираем начальную частоту (начинать стоит с 3200 МГц) и ваши чипы памяти. В обязательном порядке проходимся по таймингам из калькулятора и вручную заносим их в BIOS’е. Скачиваем программы Ryzen Master, TestMem5, опционально Aida64. Ryzen Master нам понадобится для отслеживания таймингов и сопротивлений, TestMem5 для проверки стабильности, а Aida64 для быстрого и сравнительного замера производительности памяти. Если даже с частотой в 3200 МГц система не стартует, то меняем в большую сторону procodt и tRTP, перед этим tRFC2 и tRFC4 выставляем в автоматическом режиме. Успешное прохождение теста TestMem5 позволит вам выбрать два пути дальнейших действий: при небольшом количестве ошибок можно увеличить напряжение на памяти, при отсутствии пробуем поднимать частоту. По достижении частоты 3600 МГц советуем начать ужимать тайминги.
• DRAM Calculator for Ryzen – база готовых наборов для разгона и подбора таймингов памяти;
• ZenTimings — проверка первичных, вторичных и дополнительных таймингов памяти;
• AMD Ryzen Master – официальная программа от AMD для разгона процессоров и памяти;
• TestMem5 0.12 1usmus V3 config – тест памяти на стабильность и ошибки;
• Ryzen Timing Checker – проверка первичных, вторичных и дополнительных таймингов памяти;Конфигурация - расположение модулей DIMM в слотах
Особенности работы контроллера (или контроллеров) памяти процессора приводят к тому, что число и карта расположения модулей DIMM в конкретных слотах сервера может сильно повлиять на его производительность. Несбалансированная конфигурация может иметь только 16% от потенциальной пропускной способности шины памяти. И добиться такого ухудшения характеристик можно довольно легко – лишь установив модуль DIMM в соседний слот, или добавив пару модулей в попытке расширить оперативную память и – тем самым – увеличить производительность. Такая существенная разница получается за счет технологии чередования, которую в правильной конфигурации удается реализовать процессору, а в несбалансированной системе – нет. О балансировке памяти смотрите дополнительные материалы.
Читайте также: