Memory mode bios что это sparing
Опция Dynamic Paging Mode позволяет повысить быстродействие системы путем использования динамической адресации страниц.
Использование опции Fast R — W Turn Around позволяет добавить один дополнительный такт задержки между двумя последовательными циклами обращения к памяти. Это снижает производительность памяти, но повышает стабильность ее работы.
Disabled – использовать задержку в 1 такт системной шины перед началом чтения/записи данных с оперативной памяти.
С помощью опции FSB / SDRAM / PCI Frequency ( MHz ) можно установить конкретные значения частот системной шины, оперативной памяти и шины PCI .
С помощью опции FSB : SDRAM : PCI Frequency Ratio можно установить соотношение частот системной шины, оперативной памяти и шины PCI . Опция используется только на тех материнских платах, чипсет которых поддерживает асинхронную роботу данных шин.
Linked (или Sync to CPU) – частота оперативной памяти будет изменятся автоматически после изменения частоты системной шины (будет использоваться стандартный делитель) ;
Опция Gate A 20 Option позволяет выбрать способ управления адресной линией А20. Линия А20 отвечает за доступ к памяти, физические адреса которой превышают 1 Мбайт.
Опция Graphics Aperture Size предназначена для установки максимального размера оперативной памяти, которая будет использоваться AGP -видеокартой. Оптимальным вариантом будет установка значения в размере 50% размера оперативной памяти
Использование опции Hi — Speed Refresh позволяет немного уменьшить время регенерации оперативной памяти.
С помощью опции MA Wait State можно установить дополнительный такт ожидания перед началом чтения данных из ОЗУ.
Slow (или Enabled ) – использовать установить дополнительный такт ожидания перед началом чтения данных из ОЗУ;
Fast (или Disabled ) – не использовать установить дополнительный такт ожидания перед началом чтения данных из ОЗУ.
Опция Max Async Latency определяет время, на протяжении которого процессор будет ожидать данные от самого дальнего слота ОЗУ, после чего перейдет на другой слот.
Auto – автоматическое определение времени, на протяжении которого процессор будет ожидать данные от самого дальнего слота ОЗУ;
С помощью опции Memclock to CPU Ratio можно установить (изменить) соотношение частот шины FSB и тактовой частоты модулей оперативной памяти.
Опция Memory Hole At 15-16 M позволяет использовать часть оперативной памяти в качестве кэш памяти для устройств, подключенных к шине ISA.
Опция Memory Parity Error Check позволяет задействовать контроль четности – способ обнаружения ошибок в оперативной памяти.
Опция Memory Read Wait State позволяет установить задержку в тактах системной шины при чтении данных из ОЗУ.
Опция Memory Remap Feature актуальна, если на ПК установлено более 4 Гбайт оперативной памяти и используется 64-разрядная операционная система . Опция позволяет переместить адресное пространство, используемое картами расширения, за пределы первых 4 Гбайт. Использование опции позволяет системе видеть и использовать всю доступную оперативную память.
С помощью опции Memory Test Tick Sound можно разрешить компьютеру выдавать звуковой сигнал при тестировании оперативной памяти.
Опция Memory Write Wait State позволяет установить задержку в тактах системной шины при записи данных в ОЗУ.
Enabled – использовать опцию. В случае использования данного значения активизируются две опции: n Reserved Memory Base (позволяет указать адрес области оперативной памяти, которую необходимо зарезервировать для работы подключенного устройства) и n Reserved Memory Legth (позволяет указать адрес объем оперативной памяти, которую необходимо зарезервировать для работы подключенного устройства)
Опция n Reserved Memory Base позволяет указать адрес области оперативной памяти, которую необходимо зарезервировать для работы устройства. Возможность управлять опцией появляется только в случае установки значения Enabled для опции N Memory Resources
N / A – определение области оперативной памяти, резервируемой для работы подключенных устройств, будет выполнятся автоматически;
C 800; CC 00; D 000; D 400; D 800; DC 00; – цифровое значение адреса области оперативной памяти, резервируемой для работы подключенных устройств.
Опция n Reserved Memory Legth позволяет указать объем оперативной памяти, которую необходимо зарезервировать для работы подключенного устройства. Возможность управлять опцией появляется только в случае установки значения Enabled для опции N Memory Resources
Значение объема оперативной памяти, которую необходимо зарезервировать для работы подключенного устройства.
Современные двухпроцессорные серверы — стандартная рабочая лошадка в большинстве организаций. Производительность растет, памяти добавляется, PCIe ускоряется. Казалось бы, зачем в таком случае нужны многопроцессорные системы?
Как ни тривиально это звучит, но — большие данные и критически важные для бизнеса приложения. Ведь серверы на базе E7-4800 v2 — это не только полтора терабайта оперативной памяти на сокет, но и средства повышения надежности в пределах одной системы.
Мы тоже не забыли поддержать продукт
И подробней расскажем как о полезных возможностях платформы E7 v2 с ядром Ivy Bridge- EX, так и о сервере Hyperion RS530 G4.
Сам Intel позиционирует новые процессоры как альтернативу RISC системам, в первую очередь на основе IBM POWER. Основания для этого у них есть!
Слайд взят у Intel
Разберем каждый пункт подробней.
Увеличение оной в 2 раза приведено не просто так — это ускорение сервера по сравнению с предыдущим поколением E7, на основе Westmere-EX.
Производительность процессоров в мире принято измерять с помощью тестов SPEC (Standard Performance Evaluation Corporation) CPU, актуальная версия CPU2006. Тесты делятся на целочисленные CINT и с плавающей точкой CFP, но это однопоточный результат. Для сравнения многоядерных процессоров используется rate версия.
Процессор | SPECint_rate_base2006 | SPECfp_rate_base2006 |
4x E7-4890 v2 | 2340 | 1730 |
4x E7-4870 | 1080 | 698 |
8x E7-8870 | 1930 | 1280 |
IBM Power 750 Express (4.0 GHz, 32 core, SLES) | 1230 | 1050 |
Новый четырехпроцессорный сервер полностью заменяет старый восьмипроцессорный,
например, ETegro Hyperion RS830 G3. Потребляет меньше энергии, производительность выше, стоимость ниже. На его фоне и Power смотрится довольно бледно.
Необходимо отметить, что контроллер E7 работает с памятью не напрямую, а через SMI (scalable memory interconnect) и специальный буфер. Зачем?
Высокоскоростная последовательная шина радикально облегчает разводку материнской платы, позволяя вынести память на значительное удаление от процессора и при этом сохранить пропускную способность, так как электрическая нагрузка понижена. Также упрощается дизайн райзеров памяти, которые поддерживают горячую замену и добавление памяти «на ходу».
В модели предыдущего поколения Hyperion RS530 G3 было доступно 64 слота для оперативной памяти и поддерживалось 2 терабайта в сервере.
Новый процессор принес переработанный контроллер памяти с поддержкой 24 планок памяти на процессор (96 в сервере) и частоты модуля 1600 МГц (раньше было ограничение в 1066МГц).
Помимо большего объема памяти, поддерживается переключение режимов работы — Performance и
Lockstep.
По умолчанию стоит режим Performance, который устанавливает производительность SMI на 2667MT/s и работу с восемью каналами DDR на процессор. В сумме получается 340 гигабайт в секунду пропускной способности памяти на четыре процессора. Колоссальный результат! В тесте STREAM Triad получилось достичь 244GB/s, что в 2.4 раза больше 101GB/ s у системы с E7 v1.
Режим Lockstep позволяет работать с DDR3 1600, но при этом и производительность SMI канала ограничена 1600MT/s. Поддерживается зеркалирование и memory rank sparing. При работе режима Lockstep необходимо учитывать ряд нюансов:
- Доступно максимальное количество возможностей RAS.
- Модули необходимо устанавливать идентичным парами (два в каждом из двух каналов).
- Для системы доступен полный объем памяти.
Зеркалирование снижает доступный для системы объем памяти в два раза. Memory rank sparing резервирует один rank на канал, памяти доступно больше, но и надежность не так высока, как у зеркала.
Предыдущее поколение E7 v1 полагалось на возможности чипсета 7500, который имел 32 линии PCIe 2.0. В Hyperion RS530 G3 таких чипов стояло два, что позволяло снять 64 линии на сервер.
E7 v2 получили встроенный контроллер PCIe 3.0 с 32 двумя линиями. Несколько меньше, чем у Е5-2600 (40 линий на процессор), но их же четыре. 128 линий, каждая из которых примерно в два раза быстрее PCIe 2.0 — вот четыре раза на слайде и набежало.
Проще всего сводной таблицей описать, где Romley — E5-4600; Boxboro EX — E7 v1, Brickland — E7 v2.
Не будем расписывать каждую технологию, но пять девяток в итоге набирается, всего 5 минут простоя в год.
Теперь про нас и актуальный сервер
Красота!
Расписывать долго и упорно спецификации не будем, они есть на сайте. Лучше показать самые приятные фишки на живом изделии 🙂
Горячее добавление памяти
Если заполнены не все райзеры памяти — то можно спокойно добавлять еще без остановки сервера:
Intel грозится доделать код для горячей замены памяти (работать будет только в режиме зеркалирования, в RS530 G3 работало), тогда можно будет менять сбойные планки на ходу.
Горячая замена PCIe
Слетел сетевой контроллер? FC карточка уехала крышей? Хочется добавить еще PCIe флеша? Сервер выключать не надо:
NVMe на практике
В нашей предыдущей статье, посвященной накопителям, мы упомянули о NVMe SSD и поддержке в этой модели, вот как это реализовано:
Как мы уже упоминали, разъем NVMe сделан совместимым с SAS, поэтому бэкплейн имеет контакты для подключения обычного SAS контроллера.
Бэкплейн дисков
Живая тестовая машина с E7-4880 v2 есть у нас в лаборатории и доступна для тестирования.
PS Вместе с анонсом нового поколения мы предлагаем 2 системы Hyperion RS530 G3 с четырьмя процессорами Xeon E7-8837, контроллером LSI 9260-8i и 8 райзерами для памяти со скидкой в скромные 50%.
Основные вопросы, на которые нужно ответить при выборе конфигурации памяти DDR3:
1. Нужно получить максимальный объём или максимальную производительность памяти?
2. Какие процессоры будут использоваться?
3. Какое соотношение цена/производительность для нас оптимальна?
Отличия в использовании DDR2 и DDR3
DDR2 и процессоры Intel Xeon 5400
– До 4 DIMM на канал
– Память Fully-buffered DDR2 533/667/800
– Максимальный объем 128Гб
DDR3 и процессоры Intel Xeon 5500
– До 3 DIMM на канал
– Память DDR3 800/1066/1333
– Максимальный объем 144Гб
Варианты конфигурирования
Для оптимального выбора конфигурации DDR3 необходимо четко понимать, что нам важнее производительность или объем. Ниже представлены конфигурации для этих обоих вариантов и сбалансированный вариант.
Максимальная производительность
Для обеспечения максимальной производительности необходимо использовать память DDR3 с частотой 1333MHz и процессоры серии X5550, т.к. только они способны обеспечить необходимую пропускную способность шины QPI (10,6 GB/s). Такая конфигурация накладывает ограничение на максимальный объем памяти в 48GB, т.к. возможно установить только 1 модуль памяти на 1 канал процессора.
Максимальная производительность
Максимальный объем
В этом случае необходима память с частотой 800MHz и любые процессоры серии X5500. Пропускная способность шины QPI при этом будет 6,4GB/s. При этом можно будет установить до 18 модулей памяти, то есть по 3 модуля на канал, и получить объем в 144GB.
Максимальный объем
Сбалансированный
Оптимальный вариант, межу производительностью и объемом. Необходимо использовать память DDR3 с частотой 1066 MHz, процессоры серии E5520 или старше. В такой конфигурации возможна установка по 2 модуля памяти на канал (всего 12 модулей) и получить общий объем памяти 96GB.
Сбалансированный вариант
Типы памяти
Но это не все. Кроме ранжирования по скорости MHz, есть 3 вида памяти DDR3: Registered DIMMs (RDIMM), Unbuffered ECC DIMMs (UDIMM ECC) и Unbuffered DIMMs (UDIMM). Сразу отмечу что Unbuffered DIMMs (UDIMM) не рекомендуется использовать в серверах. Так же модули памяти бывают разных рангов.
Сравнение UDIMM и RDIMM:
800, 1066, 1333 МГц
800, 1066, 1333 МГц
Максимальное кол-во модулей на канал
RDIMMs:: Хотя они на несколько процентов медленнее чем UDIMM, они позволяют получить больший общий объем памяти. Поддерживают до 3 DIMMs/канал.
UDIMM ECC: поддерживает все RAS функции RDIMM кроме x4 Single Device Data Correction (SDDC).
Для систем начального уровня с объемом ОЗУ 12Гб или меньше, целесообразно использовать UDIMM ECC, т.к. у них меньше стоимость. Регистровую память имеет смысл использовать в материнских платах, где по 3 слота на канал (на будущее расширение без выбрасывания старой памяти) или модули по 4ГБ.
Относительная стоимость модулей
Ранги (Single, Dual, Quad)
Не будем детально разбирать вопрос рангов. Остановимся на наиболее важных моментах. Итак, на рисунках наглядно показано основные отличия разноранговой памяти. Технологически, при производстве, дешевле размещать большее чипов на одном модуле, то есть изготавливать память типа quad rank.
Физическое устройство разноранговой памяти
Латентность QR модулей меньше, т.к. в них одновременно может быть открыто несколько страниц. Так же есть ограничение в 8 рангов на канал, т.е в один канал можно поставить только 2 QR модуля (у разных производителей, кол-во поддерживаемых рангов может отличаться в зависимости от модели материнской платы). На данный момент Quad Rank бывают только модули RDIMM.
Еще отмечу момент, что при установки памяти с разным количеством рангов, первыми устанавливаются QR модули, потом DR и SR.
Выбор модулей оптимального объема.
Сейчас рассмотрим, какого объема лучше использовать модули, для получения необходимого объема памяти на ядро. Т.к. это позволит сэкономить деньги, и получить оптимальную производительность.
При использовании RDIMM-ов, возможны следующие конфигурации (при использовании 2х 4х ядерных процессоров Nehalem-EP)
В таблице представлены основные конфигурации памяти. Сначала в первой строке выбираем желаемый объем памяти на 1 ядро.
Во второй строчке указа общий объем памяти, который мы получим.
Далее ниже рассмотрены варианты с разным объемом каждого модуля. Красным выделены оптимальные конфигурации.
При использовании UDIMM-ов ECC (при использовании 2х 4х ядерных процессоров Nehalem-EP)
DDR3 UDIMMs ограничены 2 DIMMs на канал, или в общей сложности 12 DIMMs.
Принцип выбора тот же что и при RDIMM.
Баланс памяти по каналам в конфигурации
В таблицах есть не сбалансированные конфигурации. Не сбалансированной конфигурация считается, если не используются все 3 канала памяти на процессор или число модулей не кратно 3 модулям на процессор. Конфигурация, когда используется два канала из трех, можно считать сбалансированной, т.к. interleave работает, но только на 2 канала.
Так же возможна конфигурация, когда вся память находиться у одного процессора. Она возможна при использовании Non-Uniform Memory Access (NUMA).
Примеры несбалансированных конфигураций
Сбалансированная конфигурация: задействовано больше каналов, выше пропускная способность памяти.
· Пропускная способность одинакова при использовании 1 модуля памяти на канал и при использовании 2х модулей на канал (как на DDR3 1066)
Несбалансированная конфигурация: уменьшенная пропускная способность (до 17%)
· Не работает Interleave во всех 3х каналах
· Приводит к снижению пропускной способности на 2-1-1 против 1-1-1 конфигурации
Пропускная способность памяти. Сравнение сбалансированной и не сбалансированной конфигурации (DDR3 1066).
Разница в скорости на разных конфигурациях
Очень хорошо видна разница в пропускной способности памяти в разных режимах:
DIMM Population (CPU 0 / CPU 1)
STREAM Triad Result
4.8GT/s QPI
STREAM Triad Result
5.86GT/s QPI
STREAM Triad Result
6.4GT/s QPI
Page 39: Memory sparing, Memory mirroring
Four memory channels are allocated to each processor. The allowable configurations depend on the memory mode
selected.
NOTE: x4 and x8 DRAM based DIMMs can be mixed providing support for RAS features. However, all guidelines for
specific RAS features must be followed. x4 DRAM based DIMMs retain Single Device Data Correction (SDDC) in
memory optimized (independent channel) mode. x8 DRAM based DIMMs require Advanced ECC mode to gain
SDDC.
The following sections provide additional slot population guidelines for each mode.
Advanced ECC (Lockstep)
Advanced ECC mode extends SDDC from x4 DRAM based DIMMs to both x4 and x8 DRAMs. This protects against single
DRAM chip failures during normal operation.
Memory installation guidelines:
Memory modules must be identical in size, speed, and technology.
DIMMs installed in memory sockets with white release tabs must be identical and similar rule applies for
sockets with black and green release tabs. This ensures that identical DIMMs are installed in matched pairs –
for example, A1 with A2, A3 with A4, A5 with A6, and so on.
NOTE: Advanced ECC with Mirroring is not supported.
Memory Optimized (Independent Channel) Mode
This mode supports SDDC only for memory modules that use x4 device width and does not impose any specific slot
NOTE: To use memory sparing, this feature must be enabled in the System Setup.
In this mode, one rank per channel is reserved as a spare. If persistent correctable errors are detected on a rank, the
data from this rank is copied to the spare rank and the failed rank is disabled.
With memory sparing enabled, the system memory available to the operating system is reduced by one rank per
channel. For example, in a dual-processor configuration with sixteen 4 GB dual-rank DIMMs, the available system
memory is: 3/4 (ranks/channel) × 16 (DIMMs) × 4 GB = 48 GB, and not 16 (DIMMs) × 4 GB = 64 GB.
NOTE: Memory sparing does not offer protection against a multi-bit uncorrectable error.
NOTE: Both Advanced ECC/Lockstep and Optimizer modes support Memory Sparing.
Memory Mirroring offers the strongest DIMM reliability mode compared to all other modes, providing improved
uncorrectable multi-bit failure protection. In a mirrored configuration, the total available system memory is one half of
the total installed physical memory. Half of the installed memory is used to mirror the active DIMMs. In the event of an
uncorrectable error, the system will switch over to the mirrored copy. This ensures SDDC and multi-bit protection.
Memory installation guidelines:
Memory modules must be identical in size, speed, and technology.
DIMMs installed in memory sockets with white release tabs must be identical and similar rule applies for
sockets with black and green release tabs. This ensures that identical DIMMs are installed in matched pairs –
Приветствую друзья. Данная статья расскажет об одной опции, которую может содержать BIOS персонального компьютера. Помните! Просто так никакие настройки биоса не изменяйте — может нарушить стабильную работу компьютера.
DVMT Memory — что это в биосе?
Технология Dynamic Video Memory, динамически распределяющая оперативную память для использования в качестве видеопамяти (VRAM) встроенного графического ядра процессора.
Простыми словами: технология, которая берет часть оперативки для видеопамяти, обьем динамически изменяется, учитывая запущенные приложения, игры. Суть — автоматическое изменение размера, при необходимости технология увеличивает обьем, когда видеопамять не используется — технология автоматически уменьшает обьем.
Некоторые BIOS материнских плат позволяют регулировать максимально допустимый обьем DVMT.
Встроенное графическое ядро в процессорах Intel в большинстве случаев может увеличить видеопамять до значения 1.7 гб.
Например BIOS может содержать функцию DVMT Memory, позволяющую вручную указать максимально допустимый обьем.
DVMT Mode Select
Данная настройка позволяет указать тип резервирования оперативной памяти под нужды встроенного видеоядра процессора (iGPU). Режимы могут быть разные, зависит от модели материнской платы, однако основные следующие:
- Fixed Mode — указанный обьем будет фиксированным/постоянным, изменяться не будет.
- DVMT Mode — выделение видеопамяти происходит только в динамическом режиме, автоматически увеличивая и при неиспользовании — уменьшая размер.
- Fixed+DVMT Mode — одна часть выделенного обьема остается фиксированной, другая — динамической.
Значение можно указать например опцией DVMT Pre-Allocated, которая задает предварительный размер видеопамяти. Предположительно имеется ввиду какой может быть максимальный обьем.
В основном нет смысла устанавливать большой размер видеопамяти. Причина — встроенная видеокарта процессора достаточно слабая, идеально подходит под офисные задачи, просмотра фильмов. Большой обьем только незначительно увеличит производительность игр. Играть на встройке — сомнительное удовольствие, лучше купить недорогую отдельную видеокарту и не использовать встроенное видеоядро вообще, тем самым освободив полностью оперативную память (RAM).
Бытует мнение, что в сервере все настройки BIOS-а, которые касаются оперативной памяти, нужно оставить в значении «Авто», ставить модули парами, одного производителя и одинакового объема, покупать только одного производителя и даже одной серии.
Нам на тест поступили два модуля памяти Transcend DDR4-2400 ECC RDIMM, и сегодня мы проверим древние мифы и посмотрим, на что вообще влияет память, когда дело касается двух типов виртуальных машин: VDI (виртуальный рабочий стол) и SQL. Наш тестовый стенд имеет следующую конфигурацию:
- Intel Xeon E5-2603 V4
- Материнская плата на чипе Intel C-612
- Гипервизор VMware ESXi 6.7
- FreeNAS 11.2 NFS DataStorage
- Debian 9 Stretch (Sysbench OLTP)
- MariaDB 10.1.26
Чтобы в тесте OLTP, эмулирующем нагрузку базы данных, максимально выйти на работу с ОЗУ, мы использовали следующие настройки сервера БД. В процессе тестирования, виртуальная машина потребляла в среднем 1.5 Гб ОЗУ, так что от объёма памяти мы не зависим.
Виртуалка с тестом хранилась на томе, созданном FreeNAS, установленным на том же тестовом стенде и подключенном через NFS. Таким образом, мы максимально дистанцировались от дисковой системы, рассчитывая на то, что кэш LARC этой операционной системы для СХД сгладит любые обращения базы данных к хранилищу, и опять же создаст нагрузку на память. Запуск каждого OLTP теста производился трижды со следующими параметрами:
sysbench --test=oltp --oltp-table-size=100000 --mysql-db=test --mysql-user=root --mysql-password=12345 --max-time=300 --oltp-read-only=off --max-requests=0 --num-threads=16 --percentile=99 run
Результаты третьего теста записывались как итоговые.
Модули памяти Transcend TS1GHR72V4H
В регистровых модулях памяти RDIMM, связь между контроллером ОЗУ, установленным в процессор и чипами DRAM на планке памяти осуществляется напрямую, и лишь адресные и командные сигналы буферизуются в дополнительном чипе, установленном на плашке памяти, называемом регистром. Такая компоновка позволяет производить 4-ранговые модули памяти для использования в серверах с 12 и большим количеством слотов DIMM. Говоря проще, регистр позволяет установить больший объём памяти в один сервер.
Модуль памяти TS1GHR72V4H - это 2-ранговый DDR4 2400 DIMM. Объём набран 16 микросхемами SEC 725 серии K4A4G08 5WE BCRC производства Samsung. Эти чипы относятся к поколению E-die, которое само по себе рассчитано на частоты выше 3000 МГц, то есть на плашках памяти DDR4-2400 эти чипы, можно сказать, "отдыхают".
Основная задержка CAS составляет 17 тактов, рабочий диапазон температур - от 0 до 85 градусов Цельсия, хотя по нашим тестам, как будет показано далее, память не нагревается и наполовину максимально допустимых значений.
Интересно, что в нашем тестовом комплекте использовались разные регистровые драйверы. На одной плашке - Inphi iDDR4RCD2-GS01, а на другой - IDT 4RCD0124KCO. Для первого производитель заявляет допустимую температуру аж до 125 градусов Цельсия, для второго такой информации нет, но в целом изучив документацию к чипам, можно сказать, что они идентичные. В обоих случаях на плашках памяти устанавливались температурные сенсоры Microchip AT30TSE004A.
В целом, по конструкции модулей памяти, пожалуй больше сказать нечего: чипы DRAM имеют огромный запас по частоте, регистр - огромный запас по нагреву. Для серверных компонентов это важно - понимать, что оборудование работает далеко не на пределах своих возможностей.
Тестирование
Итак, первое, с чего мы начнём - это посмотрим, что даёт отключение ECC в BIOS-е. Технически, коррекции ошибок выполняет регистровый чип, поэтому не думаю, что мы получим какую-то разницу в скорости.
Синтетика и реальная задача показали диаметрально противоположные результаты. В AIDA64 задержка чуть выросла, а в базе данных - наоборот, снизилась.
Следующим этапом включим ADR, аппаратное асинхронное обновление DRAM, - функция, предназначенная для энергонезависимой памяти NvDIMM. При её включении, контроллер памяти запускает аппаратное прерывание и автоматически обновляет страницы памяти, содержащиеся в модулях DRAM. Это позволяет поддерживать актуальность информации, хранящейся в памяти на случай отключения питания. Для обычной памяти RDRAM оно не должно иметь никакого значения.
Я бы даже сказал, что эта функция тормозит работу подсистемы памяти, так что включать её не следует.
Зеркалирование RAS Mirror - функция, предназначенная для создания избыточности на уровне банков памяти. Здесь можно провести аналогию с RAID 1 для жёстких дисков: контроллер разделяет общий объём ОЗУ на 2 канала, один из которых дублирует второй. В случае если в одном из каналов произошло повреждение данных, контроллер восстанавливает данные из второго канала. В отличии от полного зеркалирования, RAS Mirroring требует поддержки со стороны операционной системы, которой на этапе загрузки надо сообщить, какой именно объём памяти будет работать в отказоустойчивом режиме. Допустим, у вас 128 Гб памяти - вы можете включить зеркалирование адресного пространства до 4 Гб и 20 Гб адресного пространства выше 4 Гб. Таким образом, общий доступный объём памяти для операционной системы составит 113 Гб, но память, занятая ядром ОС будет защищена от невосстанавливаемых ошибок, что повысит надёжность работы сервера.
Если же не трогать настройки операционной системы, то включение RAS Mirror в BIOS ничего не даст, кроме небольшого снижения производительности.
Ещё одной разновидностью защиты от сбоя является Rank Sparing. В отличии от RAS Mirror, это полностью аппаратная функция, суть которой в том, что половина объёма памяти держатся в резерве на случай сбоя в основном канале памяти. В случае возникновения восстанавливаемой ошибки в модуле DIMM, его содержимое копируется в запасную память, а сбойный ранг или целиком DIMM модуль отключается. Для операционной системы в случае включения Rank Sparing, доступно ровно половина общего объёма ОЗУ.
То есть, если RAS Mirror способен защитить от ошибки в памяти и не допустить зависания операционной системы, то Rank Sparing действует уже после того, как ошибка обнаружена и предотвращает использование сбойного модуля DIMM. Как видно по результатам тестов, включение этой функции негативно влияет и на синтетический тест, и на реальное приложение.
Ручное выставление чередования каналов и рангов. У меня нет никаких сомнений, что BIOS автоматически определяет оптимальный режим чередования рангов и каналов памяти для максимальной производительности. У нас в сервере установлены дв двухранговых модуля, так давайте для них зададим вручную значение 2 Channel Interleaving + 4 Rank Interleaving.
Небольшое влияние на производительность есть, но оно находится в пределах погрешности.
Первый вывод: всё уже настроено до нас
Первый вывод напрашивается сам собой: в автоматическом режиме память уже настроена на максимальную производительность. Какие-либо ошибки ручной настройки могут привести к незначительным колебаниям производительности в реальных приложениях, находящимся на уровне погрешности. Если нет необходимости настраивать зеркалирование рангов памяти, то в подсистему памяти сервера лучше не лезть: расширенных настроек латентности там нет, а выставить частоту DIMM выше, чем указано в документации к процессору, BIOS серверной платы не позволит.
Что же делать?
Если нам нужно выжать максимум из подсистемы памяти, то надо заниматься не настройками BIOS-а, а настройками гипервизора, в частности - распределением ресурсов vCPU между виртуальными машинами. Рекомендованные значения не всегда окажутся лучшими с точки зрения производительности, и если физических процессорных ядер меньше, чем выделено гостевым операционным системам, то правило "больше = лучше" уже не работает, и оптимальное соотношение ресурсов устанавливается опытным путём.
Очень интересно выглядит тест AIDA64, достаточно лёгкий для сервера, - он не использует дисковую подсистему от слова "совсем". Но при конфигурации 6 vCPU для Windows 7, у нас ещё 2 vCPU выделены под FreeNAS, который находится в состоянии простоя. Тем не менее, мы видим ощутимый удар по подсистеме памяти, и это - как раз и есть плата за Overprovisioning виртуальных процессорных ядер. 99-процентная задержка в OLTP показывает, что в реальных приложениях снижение производительности так же имеет место быть.
Энергосбережение памяти
Каждый модуль памяти Transcend TS1GHR72V4H имеет встроенный датчик температуры, по которому можно отследить нагрев компонента. Основным источником тепла является, как несложно догадаться, является регистровый чип, и хотя его электрическая мощность невелика, площадь микросхемы очень маленькая, и отводить температуру следует интенсивным воздушным потоком. В BIOS-е серверных материнских плат вы можете включить энергосбережение для модулей RDIMM, но некоторые администраторы опасаются, что это приведёт к снижению производительности машины. Проверим?
Однозначно - энергосбережение памяти стоит включать, разница в нагреве модулей RDIMM в реальной задаче составляет почти 10%, а влияния на скорость меньше, чем допустимая погрешность измерений.
Несимметричный третий канал
В начале статьи было сказано, что есть дескать рекомендация ставить в сервер все модули памяти одинакового объёма, одного производителя и так далее и тому подобное. Давайте добавим к нашим двум модулям Transcend TS1GHR72V4H объёмом по 8 Гб каждый, ещё один 2-ранговый 16-гигабайтный модуль Kingston KVR21R15D4/16. Теоретически, у нас должны задействоваться 3 канала памяти, что даст значительный прирост в быстродействии системы.
Синтетика показывает, что все слухи об одинаковости модулей памяти в разных каналах не стоят и сломанного цента - три канала дают огромный прирост в скорости памяти по сравнению с двумя. Но практика показывает, что от такого прироста толку - ноль, и это самое лучшее время подвести итоги нашей статьи.
Гарантия
Модули памяти TS1GHR72V4H поставляются с пожизненной гарантией, что неудивительно, учитывая, что здесь используются чипы DRAM поколения E-Die. Сегодня виртуализация позволяет продлить срок жизни сервера, на который со временем можно перенести менее ресурсоёмкие приложения или использовать в качестве СХД, поэтому большой срок гарантии - это наиболее существенная характеристика, на которую стоит обращать внимание при выборе компонентов.
Выводы
Любой IT-администратор знает, что с выходом DDR4, влияние скорости памяти на производительность компьютера стало очень высоким. В игровых ПК и десктопах правильным подбором модулей ОЗУ можно выжать 10-15% в играх или ресурсоёмких приложениях типа Photoshop. Но в серверах, которые не дают разгонять частоту ОЗУ, нет никакого смысла заморачиваться и пытаться повысить скорость подсистемы памяти. Даже дополнительный канал памяти даёт меньший прирост скорости, чем правильная конфигурация виртуальной машины.
Поэтому выбирая RDIMM модули для вычислительного узла, можно просто брать плашки памяти Transcend TS1GHR72V4H с пожизненной гарантией. Эти модули прекрасно себя чувствуют на частотах ниже 2400 МГц, так что можно брать в расчете на модернизацию сервера. Встроенный термосенсор определяется BIOS-ом и аппаратным мониторингом операционной системы, режим энергосбережения не сказывается на производительности машины, но стопроцентно позитивно влияет на срок службы памяти.
В данной статье я собрал информацию о некоторых настройках BIOS материнской платы M3A32-MVP Deluxe. А точнее о тех из них, которые интересны при разгоне. Все, что сказано ниже не является абсолютной истиной и было собрано из различных источников, в большинстве своем англоязычных. Поэтому выношу этот материал на обсуждение. Тем более, что сам хотел бы узнать побольше о некоторых опциях. Личное мнение от использования тех или иных настроек я записывал под знаком *. Вот подходящая ветка на оверах, где можно и нужно обсудить данный материал. Осталось добавить, что на данной МП я разгонял Athlon 64 x2 4400+ Brisbane, поэтому, возможно список оп.
В данной статье я собрал информацию о некоторых настройках BIOS материнской платы M3A32-MVP Deluxe. А точнее о тех из них, которые интересны при разгоне. Все, что сказано ниже не является абсолютной истиной и было собрано из различных источников, в большинстве своем англоязычных. Поэтому выношу этот материал на обсуждение. Тем более, что сам хотел бы узнать побольше о некоторых опциях. Личное мнение от использования тех или иных настроек я записывал под знаком *. Вот подходящая ветка на оверах, где можно и нужно обсудить данный материал. Осталось добавить, что на данной МП я разгонял Athlon 64 x2 4400+ Brisbane, поэтому, возможно список опций неполный по сравнению с использованием Phenom-ов.
Jumper Free Configuration
AI Overclocking [Manual]
Установка значения Manual открывает Вашему взору следующие опции:FSB Frequency [200-600 MHz]
Значение, которое наряду с множителем задает устанавливает частоту процессора. Например, 200 FSB x 11 = 2.2 Ггц.PCIE Frequency [100-150 MHz]
Рекомендуется устанавливать не более 115-118 МГц, при этом можно добиться небольшого увеличения производительности в 3D-приложениях. Установка значений превышающие данные может вызвать проблемы в работе южного и северного мостов и, как следствие, проблемы в работе периферии и жестких дисков, но кого этим испугаешь ;)Processor Frequency Multiplier [x4 — x11,5]
В режиме AI Overclocking Auto BIOS устанавливает заданную по умолчанию частоту CPU. В режиме Manual можно задать множитель из приведенного интервала.CPU-NB HT Link Speed [200-1000MHz]
Частота HT для Phenom-ов от 200 до 2200МНzCPU VDDA Voltage [2,5-2,8v]
* Толкового объяснения в русскоязычном интернете не нашел. По поиску нашел на одном из англоязычных форумов объяснение, что этот параметр устанавливает схему регулирования центрального процессора и манипуляциями с ним можно добиться стабильности при разгоне. Проверил, действительно, на комп на пределе разгона (проц Athlon 64 x2 Brisbane 4400+ @ 3300Гц 1,6v) при значении данной опции 2,5v грузился через раз, а при установке ее в 2,8v он у меня прошел SuperPi32M, правда, ОССТ не выдержал. При этом, помогло именно значение 2,8v, с 2,6 и 2,7 была та же картина, что и с 2,5.NorthBridge Voltage [Manual]
Данная установка открывает следующие опции:Hyper Transport Voltage [1,2-1,5v]
Выставляет напряжение на шине Hyper Transport.
* При разгоне ставил 1,3v.Southbridge Voltage [1,2-1,4v]
* При разгоне выставил 1,3v.Auto Xpress [Auto, Enabled, Disabled]
Про эту опцию можно сказать следующее:
Уже в случае с AMD 790X, впрочем, перечень характеристик пополняется за счет Auto Xpress (автоматическое увеличение рабочей частоты шины PCI Express при установке видеокарт AMD на платы с чипсетом AMD; использование специальных режимов работы с DDR2 памятью), GPU-Plex, Quad PCIE Blocks и CrossFireX. Последняя технология особо интересна тем, что отныне в режиме CrossFire могут быть объединены три или даже четыре графических адаптера AMD. Перечень CrossFireX-совместимых видеокарт на данный момент состоит из решений AMD поколения Radeon HD 3800. При производстве новых чипсетов компании был использован 65 нм техпроцесс. Энергопотребление данных наборов системной логики составляет 10-12 Вт (TDP).
Будучи объединенными вместе, все вышеперечисленные компоненты (процессоры Phenom, чипсеты AMD 7, адаптеры Radeon HD 3800 и технология CrossFireX) составляют новую платформу для "энтузиастов" под названием AMD "Spider".CPU Tweak [Enabled, Disabled]
В BIOS от Asus так называется TLB-патч для процессоров Phenom.Memory Configuration
Bank Interleaving [Auto, Disabled]
Включение этого режима позволяет работать с банками по очереди, то есть получать данные из одного в то время, когда другие заняты. Причем выбор значения 2-Way позволяет чередовать пару банков, а 4-Way – четыре банка (они есть у большинства микросхем DIMM-модулей), а это, конечно, выгоднее.
* В тесте памяти Everest с данной опцией Disabled результат снижается на ~2,5% по сравнению с Auto.Channel Interleaving
* У меня эта опция была в BIOS версии 0801, с которой она и продавалась. После прошивки до последней версии 1102 я ее не обнаружил.DCT Unganged Mode [Enabled, Disabled]
При установке Disabled чипсет должен работать с памятью частотой до 800МГц. Enabled позволяет включить делитель для памяти 1066МГц. Это можно сделать при установке процессоров Phenom.Read Delay [0,5-4 memory CLKs]
Это поле определяет задержку от включения DQS ресивера до начала чтения первых данных с клавиатуры, получаемых FIFO.
000b = 0.5 Memory Clocks
001b = 1 Memory Clock
010b = 1.5 Memory Clocks
011b = 2 Memory Clocks
100b = 2.5 Memory Clocks
101b = 3 Memory Clock
110b = 3.5 Memory Clocks
111b = 4 Memory Clocks
Прямая корреляция w/memory's время ожидания. Чем ниже установка, тем ниже время ожидания.
* Со значением 0,5 комп не стартовал, сброс CMOS. С 1 стартует, но пишет что-то вроде ошибки при проверке DRAM. Нормальный запуск при 1,5. В бенчмарке памяти и кэша Everest прирост по сравнению с настройками по умолчанию: по Read — 1,9%; по Copy — 0,5%; по Latency — уменьшение времени доступа на 2,8 ns. По Write изменений нет.Memory Clock Tristate C3/ALTVID [Enabled, Disabled]
Позволяет частоте памяти DDR быть в трех состояниях (tristated), когда включен дополнительный режим VID. Этот бит не имеет никакого эффекта если установлен бит DisNbClkRamp (Function 3, Offset 88h).Power Down Enable [Enabled, Disabled]
Если данный режим активирован, то после ввода включения режима Sleep Mode, главному внутреннему тактовому генератору запрещено передавать сигнал на чип устройства. При этом большая часть связанной схемы может отключена от питания для сохранения энергии.
DCQ Bypass Maximu [0x-14x]
Управляющий контроллер обычно позволяет производить за проход другие операции по порядку, чтобы оптимизировать пропускную способность DRAM. Это поле определяет максимальное количество раз, которое самый старый запрос доступа к памяти в очереди контроллера DRAM может быть отложен перед выполнением, и самый старый запрос доступа к памяти будет выполнен вместо другого.
0000b = Никогда не откладывается; самый старый запрос никогда не откладывается.
0001b = самый старый запрос может быть отложен не больше, чем 1 раз.1111b = самый старый запрос может быть отложен не больше, чем 15 раз.
* оптимальное значение для быстродействия 4. При этом в тесте памяти Everest наибольшая скорость копирования. На чтение, запись и латентность это значение почти не влияет.DRAM Timing Configuration
Memory Clock Mode [Auto, Limit, Manual]
Установка в Manual открывает следующую опцию:Memory Clock Value [400, 533, 667, 800]
Позволяет установить делитель для памяти.2T Mode (Slow Access Mode) [Auto, Enabled, Disabled]
Медленный доступ к памяти. Этот бит управляет использованием режима таймингов 2Т. 2T режим может быть необходим, чтобы выполнить электрические требования некоторых скоростных DIMM и загрузочных конфигураций.
0 (2Т отключен) - DRAM адрес и контрольные сигналы передаются за один цикла MEMCLK.
1 (2Т включен) - один дополнительный MEMCLK обеспечивается для всех адресов DRAM и контрольных сигналов кроме CS, CKE и ODT; то есть, эти сигналы передаются за два цикла MEMCLK, а не за один.
* 1Т — преимущество в скорости работы памяти (чтение, копирование, уменьшение latency). Включить 1Т можно установкой данной опции в Disabled или через Memset из виндовс.DRAM Timing Mode [Auto, DCT0]
При установке DCT0 позволяет вручную задавать тайминги. Некоторые пункты:
TCWL [5 CLK] опция добавлена с версии BIOS 1002 (время ожидания записи - чем ниже значение, тем быстрее запись).
TRAS [18 CLK] для этой установки начиная с версии BIOS 1002 удалена следующая зависимость: Если tRTP установлен в Auto, тогда значение 2 и зависит от того, каково значение. Любая другая установка tRTP, то TRAS - 18 независимо от того, каково значение.
TRC [26 CLK] с версии BIOS 1002 отменена эта установка, если tRTP не находится в Auto. Если tRTP не находится на Auto, то TRC - 26.
tWTR [3 CLK] с BIOS версии 1002 эта установка отменена, если tRTP не находится в Auto; иначе окончательное значение будет уменьшено на 1.
tRTP [2-4 CLK] В в BIOS версии 0801 при установке чего-нибудь все равно Auto; для TRC и TRAS отменены в версии 0902 значения 2-4 CLK и функционирование TRAS, как установлена.
tRWTTO [4 CLK] Для моей памяти это Auto или то же самое, что и tWR или не будет загружаться.
tWRRD [0 CLK] эти последние три параметра нужны для таймингов от модуля к модулю (Для бенчмарков рекомендуется устанавливать их соответственно на 0,1 и 2)PLL1 Spread Spectrum [Enabled, Disabled]
PLL2 Spread Spectrum [Enabled, Disabled]
Опция Spread Spectrum позволяет сгладить пики и уменьшить интерференцию, а также уменьшить взаимное электромагнитное влияние различных компонентов системной платы друг на друга за счет изменения их частоты в некоторых пределах. Рекомендуется отключить для стабильности системы.PCI Express Configuration
GFX Dual Slot Configuration [Enabled]
GFX2 Dual Slot Configuration [Disabled]
Peer-to-Peer among GFX/GFX2 [Disabled]
Данные опции определяют сколько и в каком режиме будет работать видеоадаптеров, размещенных в слотах. С такими значениями — будут задействованы платы, подсоединенные к верхним синему и черному слотам в равном состоянии для получения запросов и команд.GPP Slots Power Limit, W [25]
Ограничение мощности слотов GPPLink ASPM [L0s & L1]
ASPM обозначает Active State Power Mangement. Кроме соответствия традиционным требованиям энергосбережения, стандарт PCI Express обладает и эксклюзивными механизмами управления питания — это ASPM, Active State Power Management. ASPM обладает завидной автономностью и способен переводить устройство в оптимальный режим работы без инструкций свыше (со стороны ПО). Это не означает, что устройство, давно не подававшее признаков активности, будет полностью отключено, но переведено в режим пониженного потребления L0s - наверняка. Стандарт PCI Express считает устройство неактивным, если за время, равное 7 мкс, с ним не было никакого обмена данными. Как только возникает потребность в обмене, устройство возвращается в рабочее состояние. У различных устройств может быть абсолютно разное время «засыпания» и «пробуждения», поэтому эти параметры сообщаются Active State Power Management на этапе конфигурирования.Link Width [Auto, x1Mode, x2, x4, x8, x16]
режим работы слота.Slot Power Limit, W [175]
максимальная потребляемая мощность, которая может быть подана через слот (0-250).NB-SB Port Features
NB-SB Link ASPM [Disabled, L1]
NP NB-SB VC1 Traffic Support [Disabled, Enabled]
виртуальный канал 1) помогает с асинхронным режимом управлять потоком данных и голоса по IP.Hyper Transport Configuration
Isochronous Flow-Control Mode [Disabled, Enabled]
Часть спецификации HTT со времен AGP 8X.В случае если разработчик решает обеспечивать поддержку управления изохронного потока данных, в дополнение к стандартным трем виртуальным каналам, каждый интерфейс ресивера, который поддерживает изохронный поток, получит еще шесть ресиверов управления потоком, буферы и счетчики, и дополнительно установленный трансмиттер управления потоком счетчиков. Попутно ресивер определяет, какой буфер управления потоком данных (изохронный или стандартный) пакет должен использовать, это определяется посредством бита в пакете запроса (Isoc бит). Если Isoc бит задан в запросе, то он будет также определен в ответе, когда он возвратится - снова идентификация буфера, установленного для использования.
Принимающие устройства, которые видят пакеты запроса с установленным Isoc бит, но которые не находятся в изохронном режиме управления потока, не используют выделенные изохронные буферы управления потоком данных для их обработки. В этом случае, используются стандартные шесть буферов управления потоком данных и NOP буфер возвращает модифицированные пакеты на передатчик, все применяются к стандартным счетчикам потока передатчика. Такие устройства сохраняют Isoc бит и в пакете запроса и в его ответе, поскольку они отправляют его следующему устройству; По пути, если есть устройство, которое действительно поддерживает изохронный трафик, оно может использовано.
* Сказал много, а толку нет Проще говоря, лучше эту опцию держать Enabled.HT Link Tristate [Disabled, CAD/CTL, CAD/CTL/CLK]
Включите вариант с тремя состояниями, чтобы уменьшить потребляемую мощность. По умолчанию нет линий в трех состояниях. Также CAD/CTL или CAD/CTL/CLK линии могут быть в трех состояниях.UnitID Clumping [Disabled, UnitID 2/3, UnitID B/C, UnitID 2/3&B/C]
Включите для поддержки UnitID clumping, чтобы увеличить число отдельных запросов, поддерживаемых одиночным устройством. Это возможно включит для PCI-Express GFX линии в некоторых конфигурациях. Clumping можно включить, только когда используется более низкий мост номера в пределах каждого ядра PCI-Express GFX.
* Точных указаний нет. Вроде как работает вместе с Isochronous Flow-Control Mode и нужно ставить значение UnitID 2/3&B/C.2X LCLK Mode
Ничего (опция будет удалена в следующей версии).Читайте также: