Dual ddr2 800 какой процессор
В данном материале мы просто протестировали на практике несколько оверклокерских комплектов DDR2 памяти от Corsair, Crucial, Geil, G.Skill, Kingston и Mushkin.
Данный материал продолжает цикл статей, посвящённых выбору оверклокерской памяти для систем, основанных на перспективных процессорах линейки Intel Core 2 Duo. В наших предыдущих материалах мы исследовали быструю и дорогую память класса PC2-8000 и даже более скоростную, теперь же пришёл черёд ознакомиться и с менее элитной памятью класса DDR2-800 SDRAM, иное название – PC2-6400.
В первую очередь отметим, что именно DDR2-800 SDRAM в большинстве случаев следует считать лучшим выбором для использования в платформах, основанных на процессоре Core 2 Duo. Как было показано нами в статье "Выбор памяти для платформы Core 2 Duo", наивысшую производительность в разогнанных системах можно получить при синхронном тактовании процессорной шины и шины памяти. А если учесть, что наиболее типичный разгон процессоров с ядром Conroe происходит при частотах FSB порядка 400 МГц, то именно оверклокерскую DDR2-800 SDRAM можно рекомендовать для приобретения большинству энтузиастов. Тем более что, как показывает практика, многие модули памяти PC2-6400, оказываются, способны не только на работу при частоте 800 МГц с достаточно агрессивными таймингами, но и зачастую могут быть разогнаны до более высоких скоростей при некотором увеличении задержек.
Конечно, учитывая обнаруженную нами ранее универсальность быстрых модулей, отрицать возможность их эффективного применения в разогнанных системах не следует. Как показали тесты, быстрые оверклокерские модули, рассчитанные на эксплуатацию при частоте 1 ГГц и выше, способны функционировать и с достаточно агрессивными таймингами при частотах около 800 МГц. Однако не следует упускать из виду важный ценовой фактор. Модули PC2-6400 SDRAM стоят ощутимо дешевле гигагерцовой и более быстрой памяти. Именно поэтому такие модули оказываются наиболее популярными среди основной массы оверклокеров.
Надо сказать, что высокая эффективность синхронного тактования процессорной шины и шины памяти – не единственный аргумент в пользу оверклокерских DIMM со средней скоростью. Проведённые нами тесты выявили, что далеко не все LGA775 материнские платы, совместимые с процессорами Core 2 Duo, способны обеспечить стабильное функционирование модулей памяти при частотах около 1 ГГц и выше. Например, определённые проблемы возникают у плат на базе набора логики i975X, в частности, у популярной среди оверклокеров ASUS P5W DH Deluxe. В результате, PC2-8000 и более быстрая память может быть полноценно использована и реально востребована только в системах на базе набора логики Intel P965, что значительно сужает сферу применимости такой высокочастотной памяти.
Кстати, отчасти именно поэтому тесты оверклокерской DDR2 SDRAM в платформах на базе Core 2 Duo мы проводим, используя материнскую плату ASUS P5B Deluxe, в основе которой лежит набор логики Intel P965 Express. Данная системная плата даёт возможность раскрыть потенциал памяти в Core 2 Duo системах наилучшим образом, поскольку более новый чипсет от Intel лучше оптимизирован для работы со скоростной DDR2 SDRAM. Вместе с этим следует отметить, что в Socket AM2 системах DDR2 память обычно разгоняется ещё лучше. Но, по озвученным в предыдущих частях нашего тестирования причинам, в настоящем материале нас интересует эксплуатация оверклокерской DDR2 SDRAM именно в системах с процессором Core 2 Duo.
реклама
К вышесказанному остаётся добавить то, что контроллер памяти нового набора логики Intel P965 имеет ряд особенностей по сравнению с предшествующими и конкурирующими контроллерами памяти. Дело в том, что при разработке этого нового чипсета инженеры уделили внимание наделению контроллера памяти значительной интеллектуальностью: в нём впервые реализованы алгоритмы внеочередного исполнения команд, целью которых является более эффективное использование открытых в памяти страниц. Это, в конечном итоге, позволяет повысить КПД полосы пропускания DDR2 SDRAM и снизить латентности при работе с данными. Таким образом, контроллер памяти iP965 во многом отличается по свойствам и своей архитектуре от аналогичных блоков, встроенных в другие процессоры и чипсеты.
Возвращаясь к основной цели данного материала, состоящей в тестировании двухгигабайтных комплектов оверклокерскиx модулей памяти PC2-6400 SDRAM, напомним состав используемой нами тестовой системы:
- Процессор Intel Core 2 Extreme X6800 (LGA775, 2.93GHz, 4MB L2);
- Материнская плата ASUS P5B Deluxe (LGA775, Intel P965 Express);
- Графическая карта: PowerColor X1900 XTX 512MB (PCI-E x16);
- Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150);
- Операционная система: Microsoft Windows XP SP2 с DirectX 9.0c.
Набор тестов, который мы употребляли для проверки стабильности памяти, был стандартен и включал три приложения: Memtest86, S&M и Prime95. Исследование характеристик памяти проводилось при штатном для них напряжении питания, указанном производителем модулей DDR2 SDRAM.
К теме раскрытия реального потенциала двухканальной памяти DDR2 мы обращались, так или иначе, уже неоднократно. Причина этого заключается в реальном потенциале памяти типа DDR2 как таковой, пропускная способность которой в двухканальном режиме работы, начиная с самых первых вариантов вроде DDR2-533, оказывается весьма высокой и, как правило, всегда превышает пропускную способность какого-либо компонента, лежащего на пути «регистры процессора — оперативная память» и лимитирующего пропускную способность подсистемы памяти в целом.
Чаще всего, «узким местом» системы оказывалась системная шина, связывающая шинный интерфейс (BIU) процессора (фактически — его L2-кэш) с контроллером памяти, расположенном в северном мосту чипсета. Именно так обстояло дело на платформах Intel, которые, как известно, обладают именно такой организацией подсистемы памяти. Частота системной шины на этих платформах не превышает 200 (большинство систем класса Pentium 4, включая двухъядерные Pentium D) или 266 МГц («экстремальные» варианты процессоров Pentium 4 Extreme Edition и двухъядерные Pentium Extreme Edition, а также новые платформы с двухъядерными процессорами с микроархитектурой Intel Core), что в терминах пропускной способности соответствует всего лишь двухканальной DDR2-400 или DDR2-533, соответственно. В связи с этим достаточно очевидно, что использование более высокоскоростных видов памяти вроде DDR2-667, DDR2-800 и, тем более, «неофициальных» вариантов DDR2-1066 на этом классе платформ не является оправданным по крайней мере с точки зрения пропускной способности памяти. С другой стороны, более высокая частота функционирования подсистемы памяти приводит к снижению ее системных задержек, что не может не являться плюсом и служит, так сказать, некоторым словом в защиту использования высокоскоростных разновидностей памяти DDR2 на платформах Intel.
Как бы там ни было, большие надежды на раскрытие реального потенциала памяти типа DDR2-667 и выше возлагалось на новую платформу AMD «AM2» (или, более официально — AMD K8 New Platform Technology, NPT), обладающую интегрированным в процессор двухканальным контроллером памяти, отныне «переделанным» для работы с памятью типа DDR2 (от DDR2-400 до DDR2-800 включительно) вместо устаревающей DDR, которая официально так и не превзошла частотный предел в виде DDR-400. Действительно, ведь в этом случае контроллер памяти расположен непосредственно в процессоре, функционирует на полной частоте процессора и имеет свой собственный интерфейс обмена данными с оперативной памятью, частота которого может составлять от 200 до 400 МГц и задается неким целым делителем полной частоты ядра процессора. И казалось бы — ничего не мешает «прокачивать» данные из памяти в регистры процессора с максимально возможной скоростью… так нет, наши исследования показали, что «узким местом» системы в этом случае оказывается шина L1-L2 кэша процессора, обладающая сравнительно низкой разрядностью (по 64 бита — в каждую сторону) и сложной (эксклюзивной) организацией. Ее пиковая пропускная способность, в теории, равна 8.0 байт/такт, однако тесты показывают, что ее реальная пропускная способность оказывается примерно вдвое ниже (порядка 4.0 байт/такт), что недостаточно для обеспечения бесперебойной «прокачки» данных из двухканальной DDR2-800 в регистры процессора даже у процессора Athlon 64 FX-62 с тактовой частотой ядра 2.8 ГГц.
Поскольку «узким местом» системы на платформе AMD «AM2» оказались, так сказать, именно «внутренности» ядра процессора, в заключительной части упомянутого выше исследования нам ничего не оставалось сделать, кроме как предположить, что «два ядра — лучше, чем одно». Ведь шина контроллера памяти в процессорах AMD Athlon 64 X2 является общей для обоих ядер, а «внутренности» у каждого ядра свои и, следовательно, большей утилизации пропускной способности памяти можно достичь при одновременном обращении к оперативной памяти со стороны обоих ядер процессора. По крайней мере — в теории, а как оно окажется на практике, нам покажут результаты, представленные в настоящей статье.
Итак, цель исследования, поставленного в рамках настоящей статьи, заключается в сравнении эффективности утилизации пропускной способности двухканальной памяти типа DDR2-800 при обращении к ней со стороны обоих ядер процессора, по сравнению с обращением к ней лишь одного ядра. Для проведения этого исследования мы воспользовались недавно разработанной утилитой RightMark Multi-Threded Memory Test, входящей в состав тестового пакета RightMark Memory Analyzer версии 3.7 и выше. Напомним, что эта утилита рассчитана на измерение пропускной способности подсистемы памяти (либо L2-кэша процессора, чему было посвящено наше предыдущее исследование с использованием этого инструмента, либо оперативной памяти, чему посвящено настоящее исследование) в условиях одно- или многопоточного обращения при осуществлении следующих операций: чтение (Read), запись (Write), чтение с программной предвыборкой (Read PF) и запись методом прямого сохранения данных (Write NT). Для сравнения, мы решили провести это исследование не только на платформах класса AMD «AM2», но и современных платформах на базе двухядерных процессоров Intel Core 2 Duo, первые исследования которых показали не самую высокую эффективность утилизации пропускной способности даже 266-МГц системной шины процессора в условиях «одноядерного» обращения.
Конфигурация тестовых стендов
Тестовый стенд №1
- Процессор: Intel Core2 Duo E6600, 4 МБ L2, 2.4 ГГц (266 МГц x 9)
- Чипсет: Intel 965G
- Материнская плата: Gigabyte 965G-DS3, BIOS F3 от 05.09.2006
- Память: 2 x 1 ГБ Corsair XMS2-8500C5 в режиме DDR2-800, тайминги 4-4-4-12
- Видео: Sapphire Radeon X1900XTX, 512 МБ
- HDD: Western Digital WD1600, SATA
Тестовый стенд №2
- Процессор: Intel Core2 Duo E6600, 4 МБ L2, 2.4 ГГц (266 МГц x 9)
- Чипсет: Intel 975X
- Материнская плата: ASUS P5W DH Deluxe, BIOS 0801 от 14.07.2006
- Память: 2 x 1 ГБ Corsair XMS2-8500C5 в режиме DDR2-800, тайминги 4-4-4-12
- Видео: Sapphire Radeon X1900XTX, 512 МБ
- HDD: Western Digital WD1600, SATA
Тестовый стенд №3
- Процессор: Athlon 64 X2 4800+ (Socket M2), 1+1 МБ L2, 2.4 ГГц
- Чипсет: NVIDIA MCP590
- Материнская плата: ASUS CROSSHAIR, версия BIOS 0121 от 24.07.2006
- Память: 2 x 1 ГБ Corsair XMS2-6400C3 в режиме DDR2-800, тайминги 4-4-4-12 (2T/1T)
- Видео: Sapphire Radeon X1900XTX, 512 МБ
- HDD: Western Digital WD1600, SATA
Intel Core 2 Duo
Рассмотрение результатов нашего исследования мы решили начать именно с этой платформы, поскольку раскрытие реального потенциала двухканальной DDR2-800 на этой платформе следует ожидать в меньшей степени, чем на платформе AMD «AM2», которую мы рассмотрим следом.
Эффективность доступа к памяти на Intel Core 2 Duo мы решили исследовать в двух различных конфигурациях — с участием нового, так сказать, специально разработанного под новую платформу чипсета семейства Intel 965 (в виде его представителя Intel 965G на материнской плате Gigabyte 965G-DS3, стенд №1) и несколько более старого чипсета Intel 975X (материнская плата ASUS P5W DH Deluxe, стенд №2), предположительно, обладающего несколько более высокими скоростными показателями.
Результаты измерений с участием чипсета Intel 965G представлены на рисунке 1. Здесь и далее, используемый размер блока во всех случаях составлял 32 МБ (32 МБ при однопоточном доступе, 16+16 МБ при двухпоточном доступе). В условиях однопоточного обращения к памяти на этом процессоре достигается пропускная способность порядка 5.96 ГБ/с (69.8% от теоретической ПС системной шины) при операциях чтения и 2.39 ГБ/с (28.0%) при операциях записи. Использование программной предвыборки данных (Software Prefetch, дистанция предвыборки подбиралась так, чтобы показатели ПСП были максимальными и составила 1024 байта) увеличивает ПСП на чтение до 6.76 ГБ/с (79.2%), а использование метода прямого сохранения данных (Non-Temporal Store) увеличивает ПСП на запись до 4.84 ГБ/с (56.7%). Таким образом, во всех случаях реальные величины ПСП явно далеки от теоретического предела ПС процессорной шины, равного 8.53 ГБ/с. В лучшем случае (чтение с предвыборкой), они составляют примерно 80% от указанного предела.
Параллельное включение второго потока (т.е. задействование второго ядра процессора) для доступа к данным, находящимся в оперативной памяти, практически не влияет на пропускную способность памяти при операциях записи данных — как «обычной», так и методом прямого сохранения. В то же время, ПСП на чтение возрастает до 7.38 ГБ/с (на 23.8%) при операциях чтения и до 8.33 ГБ/с (на сопоставимую величину — 23.2%) при чтении с программной предвыборкой. Полученный результат выглядит намного лучше, поскольку максимальная наблюдаемая ПСП в этом случае составляет уже почти 98% от теоретического предела. Тем не менее, говорить о раскрытии потенциала DDR2-800, обладающей теоретической ПСП в 12.8 ГБ/с, здесь явно не приходится. Впрочем, учитывая пропускную способность процессорной шины на уровне DDR2-533, его и не стоило ждать на этой платформе.
Несколько иные значения абсолютных показателей ПСП наблюдаются на чипсете Intel 975X (рис. 2). Сравнивая результаты исследования этого чипсета с рассмотренными выше, нельзя сказать об однозначном преимуществе того или иного чипсета Intel. В одних случаях преимуществом обладает Intel 965G, в других — Intel 975X. А именно, Intel 975X (при прочих равных условиях) характеризуется несколько более высокими ПСП на чтение (как «обычное», так и с программной предвыборкой) в условиях однопоточного обращения — 6.15 и 6.96 ГБ/с против 5.96 и 6.76 ГБ/с. В то же время, в операциях записи данных в память (как «обычной», так и методом прямого сохранения) сравнение оказывается не в пользу Intel 975X — соответствующие величины на этом чипсете составляют 1.81 и 4.72 ГБ/с против 2.39 и 4.84 ГБ/с. Наилучший результат по ПСП в условиях однопоточного доступа на этом чипсете вновь наблюдается при чтении данных с программной предвыборкой и составляет примерно 81.6% от максимальной теоретической ПС процессорной шины.
Что касается «двухъядерного» обращения, легко заметить, что прирост от использования второго потока доступа к памяти на этом чипсете оказывается менее выраженным по сравнению с Intel 965G, как по абсолютным, так и по относительным показателям. Они составляют 7.12 ГБ/с (прирост — 15.8%) и 8.00 ГБ/с (прирост — 14.9%) при «обычном» чтении и чтении с программной предвыборкой. Следует также отметить, что на этом чипсете несколько более заметен прирост при «двухпоточной» записи данных (ПСП возрастает с 1.81 до 2.28 ГБ/с). Итак, максимально достижимая ПСП при использовании обоих ядер процессора с участием чипсета Intel 975X составляет 8.00 ГБ/с, что соответствует примерно 93.8% от теоретической ПС процессорной шины. Учитывая полученные результаты, можно предположить, что новый чипсет Intel лучше оптимизирован для работы с памятью в условиях доступа к ней со стороны обоих ядер одновременно, нежели доступа лишь одного ядра процессора.
AMD Athlon 64 X2
Для исследования платформы AMD «AM2» был выбран достаточно высокопроизводительный процессор Athlon 64 X2 4800+ с тактовой частотой ядра 2.4 ГГц. При этом, поскольку процессоры AMD позволяют непосредственно настраивать величину задержек командного интерфейса (CMD rate), измерения проводились при величине задержек 2T (типичный режим для двух 1-ГБ модулей памяти DDR2-800) и 1T. Важно заметить, что даже новейшие модули памяти DDR2-800 от Corsair — XMS2-6400C3, обладающие экстремально низкими задержками в целом (для них позволительна схема таймингов 3-4-3-9), не обеспечивают 100% стабильную работу системы при уменьшенной величине задержек командного интерфейса 1T, хотя и достаточную для проведения измерений. Поэтому результаты измерений в режиме 1T, приведенные в настоящем исследовании, более полезны с теоретической, нежели практической точки зрения. Тем не менее, они могут стать более практически полезными при использовании меньших объемов памяти, например, двух 512-МБ модулей DDR2-800.
Результаты измерений в номинальном режиме «2T» приведены на рис. 3. По сравнению с рассмотренной выше платформой Intel, для процессоров AMD характерны более высокие показатели ПСП при операциях записи (как «обычной», так и методом прямого сохранения), что хорошо известно из наших предыдущих исследований. Величины ПСП на чтение и на запись в условиях однопоточного доступа довольно близки и составляют 3.97 и 3.17 ГБ/с, соответственно, что в пересчете на теоретическую ПСП двухканальной DDR2-800 составляет всего 31.0% и 24.8%, соответственно. Использование оптимизаций — программной предвыборки при чтении данных (дистанция предвыборки 1024 байта) и метода прямого сохранения при записи данных позволяет ощутимо увеличить эти показатели до значений 7.59 ГБ/с (59.3%) и 6.90 ГБ/с (53.9%), соответственно.
Наиболее существенное возрастание ПСП при использовании двухпоточного доступа к памяти наблюдается в случае «обычного» чтения данных — соответствующий показатель возрастает до 6.76 ГБ/с, что на 70.3% выше по сравнению с однопоточным обращением. Менее заметен прирост в ПСП при двухпоточной записи данных — ПСП при этой операции возрастает до 4.11 ГБ/с, т.е. примерно на 29.7%, а также при чтении с программной предвыборкой — прирост в ПСП в этом случае составляет всего 15.9% (с 7.59 до 8.80 ГБ/с). Тем не менее, наиболее неожиданный результат наблюдается в случае записи данных методом прямого сохранения — реальная ПСП в этом случае при двухпоточном обращении оказывается ниже (примерно на 4.5%) относительно ПСП при однопоточном доступе.
Теоретически, «двухъядерный» вариант доступа к памяти, по сравнению с «одноядерным», более не должен лимитироваться скоростью обмена данными внутри процессора (т.к. каждое из ядер обладает независимыми L1- и L2-кэшем данных). Иными словами, теоретически вполне можно ожидать почти двукратное возрастание ПСП при переходе от однопоточного к двухпоточному доступу к памяти. В связи с этим, последние два результата — сравнительно невысокий прирост в ПСП при операциях чтения с программной предвыборкой и вовсе ее уменьшение при операциях записи методом прямого сохранения, по-видимому, связаны уже с ограничениями самого контроллера памяти DDR2, реализованного в процессорах AMD «AM2», на уровне шины общих запросов к контроллеру со стороны обоих ядер либо шины памяти как таковой. Как бы там ни было, наилучший результат, показанный при чтении данных с программной предвыборкой, весьма далек от теоретической ПСП двухканальной DDR2-800, т.к. составляет лишь 68.8% от этой величины.
Заключение
Проведенное исследование эффективности одновременного обращения к памяти со стороны обоих ядер современных двухъядерных процессоров Intel Core 2 Duo и AMD Athlon 64 X2 показало, что «двухъядерный» вариант доступа к памяти действительно приводит к увеличению реально наблюдаемой пропускной способности памяти. Однако нельзя сказать, что это увеличение является весьма заметным и ярко выраженным.
Так, на платформе Intel Core 2 Duo с частотой системной шины 266 МГц реальная ПСП оказывается ограниченной именно на уровне ПС процессорной шины (8.53 ГБ/с), которая заведомо меньше теоретической пропускной способностью двухканальной DDR2-800 (12.8 ГБ/с). Так что для раскрытия реального потенциала высокоскоростной DDR2 все надежды здесь следует возлагать на будущее поколение процессоров/чипсетов Intel, рассчитанных на 333-МГц частоту системной шины (что увеличит ее ПС до уровня теоретической ПСП DDR2-667).
Что касается платформы AMD «AM2», где, казалось бы, более не должно быть никаких ограничений на раскрытие реального потенциала DDR2-800 — т.к. изначально выявленные ограничения в «одноядерном» режиме доступа были связаны со скоростью передачи данных внутри самого ядра процессора. В случае двух ядер передача данных могла бы осуществляться параллельно и с удвоенной скоростью, если бы не новое ограничение, на этот раз, по всей видимости, связанное не с микроархитектурными особенностями ядра процессора, но с реализацией общей шины системных запросов и/или шины памяти интегрированного контроллера памяти.
Итак, печально, но факт: реальный потенциал двухканальной DDR2-800, в плане ее высокой пропускной способности, в очередной раз остается нераскрытым. На сей раз, не таким успешным оказался принцип «два ядра — лучше, чем одно», все «уперлось», в одном случае — в пропускную способность системной шины, в другом — в эффективность реализации контроллера памяти. Что же тогда говорить о ныне существующей, пусть и «неофициальной» пока памяти DDR2-1066, а также грядущей DDR3 с обещанными рейтингами производительности вплоть до DDR3-1600? Нам остается лишь напомнить вывод, сделанный ранее: оперативная память явно перестает быть «узким местом» системы, и производителям процессоров и чипсетов определенно стоит считаться с этим фактом. Будем надеяться, что этот опыт будет учтен с выпуском новых процессоров и чипсетов, рассчитанных на более высокую частоту системной шины либо оснащенных более совершенным интегрированным контроллером памяти.
Наше первое исследование интегрированного контроллера памяти новой ревизии процессоров AMD Athlon 64 X2/FX, ориентированного на память типа DDR2 (от DDR2-400 до DDR2-800), проведенное совсем недавно, выявило весьма посредственные характеристики подсистемы памяти на новой платформе AMD. Согласно сделанным нами предположениям, отчасти это связано с «узостью» 64-битной двунаправленной шины L1-L2 кэша данных (ее теоретическая пропускная способность напрямую зависит от частоты ядра), отчасти — с самой частотой ядра. Как мы показали, пропускная способность современной высокоскоростной двухканальной DDR2 уже оказывается сопоставимой со скоростью передачи данных внутри самого процессора. «Подтянуть» последнюю, не выходя за пределы текущей архитектуры (по-прежнему «K8», пусть уже и двухъядерной), по-прежнему можно разве что путем повышения частоты ядра. При этом возрастут скоростные показатели всех уровней подсистемы памяти процессора — L1 и L2 кэша, а дополнительным бонусом станет во столько же раз кратное увеличение частоты контроллера памяти, что благоприятно скажется на характеристиках последнего уровня подсистемы памяти — оперативной памяти как таковой.
Наше сегодняшнее исследование отличается от предыдущего, по сути, заменой процессора Athlon 64 X2 4000+ (частота ядра 2.0 ГГц) новым процессором серии «FX» Athlon 64 FX-62 (частота ядра 2.8 ГГц, что в 1.4 раза выше) при сохранении остальных компонентов платформы в почти неизменном виде. Итак, посмотрим, сможем ли мы ожидать от 40% повышения частоты ядра (а различие между процессорами Athlon 64 X2 4000+ и FX-62, по сути, заключается только в этом) сопоставимого прироста (порядка 40%) в главной характеристике подсистемы памяти — максимально достижимой реальной пропускной способности.
Конфигурации тестовых стендов
Тестовый стенд №1
- Процессор: AMD Athlon 64 X2 4000+ (ревизия ядра «F»), Socket AM2
- Чипсет: NVIDIA nForce 570 SLI
- Материнская плата: MSI K9N SLI Platinum
- Память: 2x1024 МБ Corsair XMS2 PRO PC2-6400 DDR2-800 (5-5-5-12)
Тестовый стенд №2
- Процессор: AMD Athlon 64 FX-62 (ревизия ядра «F»), Socket AM2
- Чипсет: NVIDIA nForce 570 SLI
- Материнская плата: MSI K9N SLI Platinum
- Память: 2x1024 МБ Kingston HyperX PC2-6400 DDR2-800 (4-4-4-12)
Результаты тестирования
Тестирование двухканальной DDR2-800 на новой платформе AMD Athlon 64 FX-62 (стенд №2) было решено проводить в двух наиболее скоростных режимах: DDR2-667 (ожидаемая реальная частота памяти — 311 МГц, то есть «622 МГц» в терминах DDR) и DDR2-800 (ожидаемая реальная частота совпадает с номинальной, 400 МГц). Кроме того, по сравнению с предыдущим исследованием, в каждом из этих режимов использовались две схемы таймингов — 5-5-5-12 (идентичная схеме, применяемой в прошлом исследовании) и 4-4-4-12 (номинальная для модулей памяти Kingston DDR2-800). Для сравнения, в приведенной ниже таблице представлены результаты предыдущего тестирования памяти Corsair DDR2-800 в режимах DDR2-667 и DDR2-800 с процессором Athlon 64 X2 4000+ (стенд №1).
Параметр/Режим | Стенд №1 | Стенд №2 | ||||
---|---|---|---|---|---|---|
DDR2-667 | DDR2-800 | DDR2-667 | DDR2-800 | |||
Тайминги | 5-5-5-12 | 5-5-5-12 | 5-5-5-12 | 4-4-4-12 | 5-5-5-12 | 4-4-4-12 |
Теоретическая ПСП, МБ/с | 10667 | 12800 | 9955 * | 9955 * | 12800 | 12800 |
Средняя ПСП на чтение, МБ/с | 3368 | 3590 | 3693 | 3883 | 4137 | 4393 |
Средняя ПСП на запись, МБ/с | 2759 | 2909 | 3202 | 3311 | 3514 | 3760 |
Макс. ПСП на чтение, МБ/с | 6590 (61.8 %) | 6819 (53.3 %) | 7405 (74.4 %) | 7876 (79.1 %) | 8382 (65.5 %) | 8777 (68.6 %) |
Макс. ПСП на запись, МБ/с | 5758 (54.0 %) | 5790 (45.2 %) | 7874 (79.1 %) | 7999 (80.4 %) | 8039 (62.8 %) | 8070 (63.0 %) |
Минимальная латентность псевдослучайного доступа, нс | 31.8 | 28.8 | 30.7 | 28.6 | 27.4 | 24.7 |
Максимальная латентность псевдослучайного доступа, нс | 35.1 | 31.9 | 34.0 | 31.9 | 30.4 | 27.6 |
Минимальная латентность случайного доступа ** , нс | 96.3 | 85.3 | 91.6 | 88.0 | 76.2 | 74.2 |
Максимальная латентность случайного доступа ** , нс | 99.5 | 88.5 | 97.3 | 91.7 | 78.8 | 76.4 |
* реальная частота памяти 311 МГц (2800/9)
** размер блока 32 МБ
Невооруженным глазом видно, что использование более высокой частоты ядра действительно позволяет улучшить скоростные характеристики подсистемы памяти. В режиме DDR2-667 максимальная теоретическая ПСП, как ни странно, наблюдается при записи данных в память (подобную картину мы видели в предыдущем исследовании в «младших» режимах вроде DDR2-400, но не DDR2-667) и достигает примерно 7.9 ГБ/с. Что интересно, использование более скоростной схемы таймингов 4-4-4-12 против 5-5-5-12 приводит к ощутимому увеличению ПСП при чтении данных (с 7.4 до 7.9 ГБ/с). Как показывают наши многочисленные исследования памяти DDR2 на платформе Intel, подобный эффект на последней практически не наблюдается. Так что различия в контроллерах памяти и способах организации подсистемы памяти, как говорится, налицо.
Итак, в режиме DDR2-667 на процессоре Athlon 64 FX-62 нам удалось достичь максимальную реальную ПСП, составляющую почти 80% от теоретической пропускной способности памяти DDR2, функционирующей на частоте 311 МГц. Относительно 2-ГГц ядра Athlon 64 X2 4000+, отношение максимальных величин ПСП составляет примерно 1.17 раз (при соотношении частот ядер, равном 1.4). Таким образом, повышение частоты ядра явно способствует увеличению реальной пропускной способности подсистемы памяти, но коэффициент пропорциональности между увеличением ПСП и увеличением частоты ядра оказывается явно меньше единицы (если быть точным, он равен 1.17/1.4 = 0.84). Кроме того, само 80% «раскрытие потенциала» DDR2-667, хотя и выглядит достаточно впечатляюще, все же оказывается хуже по сравнению с тем, что уже давно можно увидеть на платформе Intel с 266-МГц частотой FSB, где легко достигается реальная ПСП, практически идентичная теоретической ПС процессорной шины (8.53 ГБ/с).
Перейдем к режиму DDR2-800. С одной стороны, в этом случае «раскрытие потенциала» (учитывая, сколь велик сам потенциал) выражено в заметно меньшей степени. Максимально достижимая реальная ПСП оказалась равной примерно 8.4-8.8 ГБ/с при операциях чтения и 7.9-8.0 ГБ/с при операциях записи (эти две величины вновь поменялись местами, только на данной платформе точка достижения «преимущества чтения над записью» сместилась в область более высоких частот памяти). Это составляет всего 63-69% от теоретической ПСП, равной 12.8 ГБ/с, а также не очень сильно опережает реальную ПСП, достигаемую на платформе Intel (8.53 ГБ/с). Так что о явном преимуществе в пропускной способности нового интегрированного контроллера AMD над традиционной «шинной» организацией подсистемы памяти на платформе Intel говорить все еще не приходится. С другой стороны, прирост в ПСП относительно первой исследованной платформы в данном случае оказывается заметнее — он составляет 1.28 раз, то есть в большей степени соответствует 1.4-кратному увеличению частоты ядра процессора. Как говорится, мелочь, а приятно.
Напоследок, несколько слов о задержках при псевдослучайном и случайном доступе к памяти. Как видно из приведенной таблицы, в режиме DDR2-667 при идентичности таймингов они достаточно мало отличаются от результатов предыдущего исследования. Уменьшение таймингов до 4-4-4-12 приводит к некоторому уменьшению задержек во всех случаях (особенно выраженному — при случайном доступе), что согласуется с данными многочисленных исследований DDR2 на платформе Intel. Вместе с тем, в режиме DDR2-800 задержки при случайном доступе изначально оказываются заметно меньшими (при сохранении схемы таймингов 5-5-5-12), а их дальнейшее уменьшение при переходе к схеме таймингов 4-4-4-12 оказывается уже весьма незначительным. Таким образом, увеличение тактовой частоты контроллера памяти (в данном случае ключевую роль играет именно частота контроллера памяти, а не ядра процессора) способствует снижению задержек при доступе в память, что можно считать дополнительным преимуществом. В абсолютных величинах задержек преимущество интегрированного контроллера AMD перед «чипсетным» Intel, таким образом, становится еще более ощутимым.
Заключение
Данный материал, безусловно, относится именно к вышеописанной категории: комментарии к результатам тестов подчас настолько кратки, что возникает соблазн вообще их пропустить. Однако мы всё же считаем, что в проведении самих тестов смысл был: да, мы в очередной раз убедились в том, что старое правило действует и по сей день, однако если старые правила время от времени не проверять на практике, есть шанс когда-нибудь сделать большую ошибку…
Итак, мы сравним производительность двух процессоров в комбинации с разной памятью: ставшей на данный момент стандартом DDR2-800 и более современной и высокочастотной DDR3-1333. Процессор Core 2 Extreme QX9650 с частотой системной шины 1333 МГц будет сравниваться на одной и той же плате, поддерживающей оба типа памяти (Foxconn X38A), а процессор Core 2 Extreme QX9770 с частотой системной шины 1600 МГц — на двух разных платах. Впрочем, это платы одного и того же производителя, одной и той же серии, и практически не отличаются друг от друга, за исключением поддерживаемых типов памяти (DDR2 и DDR3). Аппаратное и программное обеспечение
Конфигурация тестовых стендов
Процессор | Core 2 eXtreme QX9650 | Core 2 eXtreme QX9770 |
Технология пр-ва | 45 нм | 45 нм |
Частота ядра, ГГц | 3.0 | 3.2 |
Кол-во ядер | 4 | 4 |
Кэш L2, МБ | 12 | 12 |
Частота шины, МГц | 1333 (QP) | 1600 (QP) |
Коэффициент умножения | 9 | 8 |
Сокет | LGA775 | LGA775 |
Типичное тепловыделение | 130 Вт | 130 Вт |
AMD64/EM64T | + | + |
Virtualization Technology | + | + |
Программное обеспечение
Необходимое предисловие к диаграммам
Форма представления результатов в используемой нами методике тестирования имеет две особенности: во-первых, все типы данных приведены к одному — целочисленным относительным баллам (производительность рассматриваемого процессора относительно Intel Core 2 Duo E4300, если скорость последнего принять за 100 баллов), и, во-вторых, подробные результаты приводятся в виде таблицы в формате Microsoft Excel, в самой же статье присутствуют только сводные диаграммы по классам бенчмарков. Тем не менее, иногда мы будем обращать ваше внимание на подробные результаты, если они того заслуживают. Кроме того, таблица для данной статьи несколько отличается от общепринятой: в ней приведены величины прироста от перехода на более быструю память для каждого теста в отдельности. Надеемся, эта информация будет полезна особо пытливым умам, которым не хватит весьма кратких общих выводов. :)
Пакеты трёхмерного моделирования
QX9650 переход на DDR3-1333 дал порядка 2% прироста быстродействия, QX9770, несмотря на более быструю шину — уже всего 1,5%.
Скорее всего сказалось то, что в случае комбинации 1333 МГц FSB (реальная частота — 333 МГц) и DDR3-1333 (реальная частота — 667 МГц), память работает действительно с частотой 667 МГц (используется «красивый» делитель FSB:DRAM 1:2). А вот в случае с 1600 МГц FSB у QX9770 (реальная частота — 400 МГц) и той же DDR3-1333, делитель FSB:DRAM равен 2:3, и реальная частота памяти составляет всего 600 МГц (получается де-факто DDR3-1200).
В свою очередь, в комбинации QX9650+DDR2-800 используется не очень «красивый» делитель FSB:DRAM 5:6, а комбинация QX9770+DDR2-800 работает вообще синхронно — 1:1. Таким образом, на 1333-мегагерцевой шине получает некий дополнительный бонус DDR3-1333, а на 1600-мегагерцевой — DDR2-800.
CAD/CAE пакеты
Здесь, наоборот, мы наблюдаем тот случай, когда при в целом более медленной 1333-мегагерцевой шине большая ПСП памяти оказывается просто не нужна.
Обработка цифрового фото
Показательны подробные результаты: наиболее ощутимый эффект даёт переход на быструю память при выполнении операций Sharp (увеличение резкости) и Resize (изменение размера изображения). Почему в последнем случае — соверешенно очевидно для всех, кто представляет себе алгоритм пересчёта картинки в более высокое или низкое разрешение.
Компиляция
Более чем прохладная реакция. Видимо, потому, что компиляторы предпочитают использовать память с ещё большей скоростью и меньшей латентностью: кэш. :)
Веб-сервер
Не самый худший из полученных результатов (около 3% прироста на QX9650 и около 2% на QX9770), но в целом не очень впечатляет.
Синтетика
CPU RightMark к скорости подсистемы памяти традиционно равнодушен…
Упаковка данных
Неплохой результат на общем фоне. Как ни странно, более чувствителен к быстрой памяти оказался WinRAR (см. подробные результаты).
Оптическое распознавание
Эффект практически отсутствует.
Кодирование аудиоданных
Старый тест, старое ПО… и почти никакого эффекта от новых технологий. :)
Кодирование видеоданных
Казалось бы, при кодировании видео хоть какой-то эффект должен быть, всё-таки обрабатываются достаточно большие массивы данных. Но нет. Остаётся предположить, что программисты кодеков не надеются на быстроту ОЗУ, и обрабатывают данные «кусочками», полностью помещающимися в кэш.
Вот это, наверное, главное разочарование: практически никакого эффекта в играх! Между тем, как раз геймеры являются традиционными поклонниками всяческого рода новинок.
Общие баллы
Чуда в очередной раз не произошло: в целом, одному из самых быстрых процессоров на шине 1333 МГц, переход на более высокочастотную память дал в среднем около 1% прироста быстродействия, единственному пока процессору для 1600-мегагерцевой шины — 2%. Как и всегда, более быстрая память появилась на горизонте задолго до того, как в ней возникла реальная необходимость. Однако не будем уподобляться малограмотным пользователям, любящим в таких случаях кричать о том, что их «обманули». Никто никого не обманывает, вот же они, результаты — смотрите на здоровье, делайте выводы. И, разумеется, рано или поздно появятся процессоры, которые смогут в полной мере задействовать скоростные возможности DDR3-1333, сомневаться в этом было бы наивно. Просто это произойдёт позже.
День добрый! Есть желание заказать оперативу с алика, однако как я понял, далеко не каждая платка подойдет под проц. Есть оператива отдельно для амд, есть отдельно для интел . Есть ли для интелов ддр 2я 4 гб одной платкой и как вообще понять какая платка к какому процу . помогите пожалуйста
скорее не так
есть переделанная серверная озу которая заводится только на определенных чипсетах от амд (на интел или не заводится или объем в 3 раза меньше)
планки эти низкого качества разгону не подлежат с другими дружат плохо единственный плюс цена
планки для интела - всего лишь надпись что это не те самы которые заводятся только на амд, а работают на любых платформах
качество чуть лучше но не сильно и нет приятной плюшки - низкой цены
ну, не все и не сразу :D Спасибо . У меня вот такие платки . Они между собой дружат не особо . Вот замену хотелось сделать (да да мать старая, выкинуть, купить новую, все это уже было) . Они вроде все по 800 ghz но между собой ладят так себе . Вот и хотелось взять 4 гб 2 планки и горя не знать. Ибо докупать еще 1 рулетка чистой воды . (лежат они в том порядке, в котором стоят в пк мать P5e vm do если что .
mаrssiсk Искусственный Интеллект (121006) при выборе старых планок озу чересчур большой выбор полунонеймов о которых достоверно ничего не известно лучший выбор на все времена - самсуньг, с другими планками вполне себе уживаются только ранки смотреть и все во время актуальности большая часть брендов делает на чипах самсунгь а вот старые версии уже делают из чего попадется и начинаются проблемы
У планок для обычных ПеКа нету разделений для Intel или AMD. Также смотри в описании к процессору.
Пример: на скриншоте показано что процессор поддерживает оперативную память 2хDDR3-1866 МГц или же максимум 2 планки типа DDR3 c частотой до 1866 МГц
сама мать поддерживает не болье 1333 ghz, вот в чем беда . Хотелось бы купить самое мощное, что доступно для моего динозавра, однако подбор для меня затруднителен
Читайте также: