Подсистема питания видеокарты это
Q: Как расшифровать маркировку вида "XX-XX" (AT-8D и т.п.) у контроллеров напряжения производства Richtek?
Подсистема питания
Подсистема питания играет важную роль на современных видеокартах. NVIDIA как раз недавно существенно улучшила систему питания на эталонных дизайнах. В линейке GeForce RTX 30 система питания очень мощная и качественная, что видно по моделям Founders Editions и эталонным дизайнам, которые используются партнерами.
В составе подсистемы питания важную роль играют модули стабилизации напряжения VRM (Voltage Regulator Modules). Они гарантируют, что напряжение 12 В, которое поступает от блока питания ПК, будет преобразовано в напряжение около 1 В, которое необходимо для питания GPU и памяти.
Многие производители подчеркивают большое число фаз подсистемы питания. Однако подход "больше - лучше" здесь работает не всегда. Как правило, чем выше тепловой пакет, то есть энергопотребление видеокарты, тем больше фаз должна содержать подсистема питания.
Правило следующее: чем больше фаз подсистемы питания установлено на видеокарту, тем лучше она справляется с подачей питания при высоких токах. Вместе с тем если фаз больше, чем требуется, то эффективность снижается. Все же большое число фаз приводят к потерям при стабилизации. Поэтому NVIDIA для линейки GeForce RTX 20 разработала систему, которая может динамически включать и выключать фазы - в зависимости от того, сколько именно питания требуется для видеокарты. В результате подсистема питания всегда обеспечивает идеальный баланс. У GeForce RTX 3090 подсистема питания 20-фазная, при этом она может динамически включать/выключать фазы. У видеокарты GeForce RTX 3080 число фаз составляет 18, у младших моделей с меньшим энергопотреблением число фаз пропорционально уменьшается.
Q: Какие напряжения на мат. платах используют системы питания с 1 и более фаз?
A: Основные напряжения на материнских платах следующие:
- Напряжение на процессоре – CPU Core Voltage (Vcore, оно же VCC). Возможные варианты – от 4-х реальных фаз до 32-х виртуальных.
- Напряжение на встроенном контроллере памяти в процессоре – CPU_VTT (оно же QPI Voltage) для процессоров Intel или CPU_NB для процессоров AMD. Обычно 1, 2 или 3 фазы.
- Напряжение на памяти – DRAM Voltage (Vdram, оно же Vddr, Vdimm, Vmem). Обычно 1, 2 или 3 фазы.
- Напряжение на северном мосту – IOH Voltage (Vioh) для чипсетов Intel, SPP Voltage (Vspp) для чипсетов NVIDIA, NB Voltage (Vnb) для остальных чипсетов. Обычно 1, 2 или 3 фазы.
- Напряжение на южном мосту – ICH Voltage (Vich) для чипсетов Intel, MCP Voltage (Vmcp) для чипсетов NVIDIA, SB Voltage (Vsb) для остальных чипсетов. Обычно 1 фаза либо LDO.
- Напряжение на Platform Controller Hub (PCH) – PCH Voltage (Vpch) для чипсетов Intel для Socket 1156. Обычно 1 фаза либо LDO.
- Напряжения остальных компонентов (PLL, HT, FSB, коммутаторы линий PCI-E) практически никогда не используют что-то более сложное, чем LDO, поэтому их можно не рассматривать.
GDDR5, GDDR5X, GDDR6, HBM
Помимо GPU, важным компонентом видеокарты остается память, поскольку она должна как можно быстрее обеспечивать графический процессор данными. Данные на видеокарту поступают через интерфейс PCI Express, они загружаются в видеопамять, после чего к ним может обращаться GPU с пропускной способностью почти 1 Тбайт/с. С годами технологии памяти совершенствовались.
GDDR (Graphics Double Data Rate) остается важным стандартом памяти современных видеокарт помимо High Bandwidth Memory (HBM). Как и в случае оперативной памяти DDR на материнских платах, GDDR тоже прошла через несколько поколений. В случае памяти DDR (и GDDR) передача данных производится на подъеме и спаде тактового сигнала. Со сменой поколений пропускная способность памяти GDDR существенно увеличилась. Вместе с тем энергопотребление продолжало снижаться. Память GDDR по 256-битному интерфейсу дает пропускную способность 25,6 Гбайт/с. У GDDR6X она достигает 936 Гбайт/с, планируются и более быстрые варианты. Тактовые частоты с поколениями увеличились со 166 МГц до нынешних 2.000 МГц и выше.
Видеокарты NVIDIA GeForce RTX базируются на новой памяти GDDR6X производства Micron. Память GDDR6X работает примерно на тех же частотах, что и GDDR6, напряжения тоже сравнимы. Но отличия имеются, к ним мы вернемся чуть ниже.
За последние годы было несколько попыток перейти на память HBM на рынке видеокарт. Однако высокая себестоимость памяти HBM и соответствующего интерфейса привели к тому, что сегодня почти все видеокарты оснащаются GDDR. На серверном сегменте все иначе. NVIDIA предлагает архитектуру Ampere в сочетании с памятью HBM, а именно A100 Tensor GPU. Память HBM2 обеспечивает пропускную способность до 2 Тбайт/с, та же GDDR6X пока не дает больше 936 Гбайт/с.
Пропускная способность памяти - спецификация техническая. Она дополняется различными алгоритмами сжатия данных в памяти. Что позволяет как сэкономить доступное пространство в памяти, так и ускорить передачу данных. Например, уже несколько поколений GPU NVIDIA используют цветовую дельта-компрессию. NVIDIA уже внедрила шестое поколение подобной компрессии.
Важно понимать, что сжатие выполняется без потерь. Так что никакие данные не искажаются, и разработчикам не приходится адаптировать свои продукты каким-либо образом.
NVIDIA использует для сжатия памяти цветовую дельта-компрессию (Delta Color Compression). Она основана на хранении полной цветовой информации только о базовом пикселе, для остальных пикселей сохраняется разница с базовым (дельта). Для этой цели используется матрица 8x8 пикселей. Поскольку близко расположенные пиксели обычно мало отличаются по цвету, хранение для них разницы оказывается по объёму информации выгоднее, чем полного значения цвета. Поэтому в случае дельта-компрессии информация о пикселях занимает меньше места в памяти, также достигается экономия пропускной способности памяти. В качестве примера работы технологии можно привести полностью черный и белый блоки, которые будут храниться в памяти как или . Здесь можно сэкономить ресурсы, сохраняя только 0.0 или 1.0 в качестве значения.
NVIDIA улучшила процедуру определения сжимаемого контента. Ранее известное соотношение 2:1 теперь может использоваться чаще, то есть применяться к большему массиву данных. Появились и соотношения сжатия 4:1 и 8:1.
Сжатие цветовой информации позволяет увеличить эффективную пропускную способность памяти, поскольку физически ей приходится передавать меньше информации. Что повышает эффективность работы интерфейса памяти.
С контроллером GDDR6(X) NVIDIA продолжила использовать технологию определения и исправления ошибок Error Detection and Replay (EDR). Память GDDR6X работает на эффективной частоте порядка 1.200 МГц. Память становится все сложнее, частоты увеличиваются, поэтому ошибки неизбежны. По этой причине с памятью DDR5 была добавлена ECC для чипов. И подобная встроенная поддержка ECC вполне сравнима с EDR.
Через Error Detection and Replay определяются ошибки (Error Detection), после чего данные передаются повторно, пока ошибок не будет (Replay). Теперь ошибки передачи определяются на уровне контроллера памяти и не приводят к появлению артефактов. Для проверки целостности данных применяется алгоритм Cyclic Redundancy Check (CRC). Если данные будут повреждены при передаче, то контрольная сумма CRC не совпадет.
Без CRC или Error Detection and Replay на высоких частотах повышается риск возникновения ошибок и появления артефактов. Также есть риск краха драйвера или системы.
Благодаря Error Detection and Replay ошибки получается выявлять и исправлять. Но при дальнейшем разгоне можно выйти на уровень, когда пропускную способность далее увеличить уже не получается. Но до этого уровня "вылетов" не происходит, можно надеяться на безошибочную работу. Таким образом, EDR не только защищает целостность данных при обычной работе видеокарты, но и помогает разогнать память до предела возможностей.
Q: Как правильно определить используемое количество фаз?
A: Для начала, нужно определить к какому напряжению относятся расположенные на плате элементы систем питания. В случае сомнений можно использовать мультиметр для замеров напряжения на дросселях. Запоминаем количество дросселей, относящихся к нужному нам напряжению, исключив из них те, что стоят на входном напряжении (обычно это одна из линий БП – +12V/+5V/+3.3V). Далее недалеко от них находим микросхему контроллера напряжения. По маркировке контроллера определяем производителя и модель. Ищем информацию об этом контроллере. Сначала конечно стоит поискать последнюю версию datasheet на сайте производителя или хотя бы страницу с кратким описанием, распиновкой и схемой включения. Если не получается найти на нужную нам модель, попробуйте поискать по маркировке без буквенных суффиксов (то есть без "А", "B", "CRZ", "CBZ" и т.п. на конце маркировки). Не всегда различные вариации одного и того же контроллера существенно отличаются между собой. Но нередко для них создается и выкладывается один общий файл с документацией. Также в сети существуют архивы с даташитами, в том числе с теми, что были удалены с сайтов производителей.
После того как узнаем максимальное количество фаз, поддерживаемых контроллером, сравниваем его с количеством дросселей, определенных ранее. Если это количество совпало, значит с большой долей вероятности система питания реализована без виртуальных фаз и количество дросселей равно количеству фаз. Но могут быть и исключения – например, если задействована только половина из возможных фаз контроллера, но при этом на каждую фазу установлено по два дросселя (мне такие варианты пока не встречались, но теоретически они тоже возможны). Если дросселей меньше, чем количество фаз контроллера, это означает, что не все фазы контроллера были задействованы и количество фаз равно количеству дросселей. Если же дросселей больше (в 2 или даже 3 раза), чем поддерживает контроллер напряжения, то тут у нас вариант с виртуальными фазами. В этом случае количество реальных фаз определяется контроллером напряжения, а количество виртуальных фаз - дросселями.
Сложнее всего, когда по контроллеру напряжения нет никакой информации в свободном доступе. В этом случае о его характеристиках остается судить лишь по косвенным признакам. Но даже в этом случае можно попытаться определить количество фаз по количеству драйверов. Необходимо только учитывать, что драйверы существуют как одноканальные (управляют только одной парой мосфетов), так и двухканальные (управляют сразу двумя парами мосфетов). Двухканальных драйверов достаточно вдвое меньше, чем одноканальных, чтобы обеспечить работу такого же количества фаз.
В случае если система питания основана на контроллере производства Intersil или uPI Semiconductor, можно попробовать поикать микросхемы ISL6611A или uP6284, использующиеся для удвоения фаз. Шесть таких микросхем в сочетании с 6-фазным контроллером позволяют получить 12 независимых фаз в системе питания, без использования параллельного соединения.
Что такое сдвоенные фазы?
В спецификации материнских плат, сконструированных на базе одного чипсета можно встретить довольно противоречивые значения количества фаз. На одних моделях производитель указывает наличие 8 или 10 фаз, в то время, как у конкурентов модели на тех-же чипсетах оснащены 16 или 20 фазами соответственно. Естественно покупатель при равных ценовых категориях предпочтет более мощную цепь питания и окажется жертвой маркетингового хода.
На самом деле фазы в описании материнских плат не всегда таковыми являются. Причина путаницы – технология «сдвоенных фаз».
Количество фаз определяет PWM-контроллер. В новейших моделях материнских плат после каждого контроллера устанавливается делитель или дублер. Он разделяет сигнал на 2 потока, каждый из которых направляется к собственной цепочке, состоящей из драйвера, ключа и фильтра. Это позволяет существенно увеличить общую мощность цепи питания, и параллельно снизить количество проходящего через каждую цепочку тока, а значит увеличить срок службы элементов цепи питания и снизить уровень нагрева. При этом сигнал существенно теряет в стабильности, поскольку временнóго смещения у пары потоков от одной фазы не будет.
Таким образом 16-фазная система питания и цепь на 8 сдвоенных фаз у материнских плат на одном чипсете – это фактически одно и то же.
Q: Какие элементы могут входить в состав системы питания:
A: Вот список основных элементов:
-
(PWM Controller). Основной элемент системы питания. Именно он определяет максимально возможное количество фаз, но не обязательно все они будут использоваться. Один и тот же контроллер может использоваться на разных моделях, но с разным количеством задействованных фаз. В качестве примера приведу 4-фазный Primarion PX3544, который используется на видеокартах GeForce 8800 GT (2 фазы), GeForce 8800 GTS 512 Mb (3 фазы) и GeForce 9800 GTX (все 4 фазы). (inductors). (capacitors). (MOSFETs). (drivers). Могут быть реализованы как в виде отдельных микросхем, так и интегрированы в контроллер напряжения, в микросхему DrMOS или даже в микросхему для удвоения фаз. Количество драйверов не может быть меньше количества реальных фаз.
- Микросхемы DrMOS. Представляют собой сборку из пары мосфетов (нижний + верхний) и драйвера в одном корпусе. Производятся компаниями Renesas Electronics, Fairchild Semiconductors, Vishay Siliconix и Infineon Technologies . Используются на материнских платах MSI и (с недавних пор - Gigabyte). Так же можно встретить на некоторых референсых видеокартах NVIDIA и ATI, например на GeForce GTX295 (Single PCB) и Radeon HD4770.
- Удвоители фаз (Phase Doubler) с интегрированными драйверами. Пока мне встречались только Intersil ISL6611A и uPI Semiconductor uP6284, которые из одной фазы делают две, преодолевая, таким образом, ограничение контроллера напряжения на количество максимально поддерживаемых фаз.
Реальные различия в использовании видеокартой линий PCi-E в тестах 3DMark:
Сравнение X16, X8 и X4 линий PCI-e версии 3.0 в GPU-Z.
Тест в играх с разным числом линий PCI-Express
Как видите, даже при сравнении 16 линий против 1й, производительность падает лишь на 12-13%. С учетом, что 1 линии PCI-e не бывает на видеокарту, то какую бы материнскую плату Вы бы не купили и сколько бы не навесили доп. оборудования. Потеря по производительности видеокарты из-за занятости каналов PCI-E, будет не более чем разница между x16 и x4, то есть 1-2%. Что совершенно не значительно и в районе обычной погрешности теста. Так, если Вы собираетесь собирать компьютер (покупать), для дома и у Вас нет RAID масивов, 2х видеокарт и прочего оборудования, то можете покупать любую материнскую плату, в плоть до H чипсета. На производительность видеокарты, это не отразиться. Но Мы советуем выбирать чипсет B , с полноценной поддержкой 2х канальной памяти, не будет потери производительности в оперативной памяти, а дороже она в среднем, лишь на 1000 рублей.
Количество линий (каналов) PCI-E, Вы можете посмотреть самостоятельно на сайте производителя в спецификации чипсета.
Количество линий (каналов) PCI-E, Вы можете посмотреть самостоятельно на сайте производителя в спецификации чипсета.
Количество линий (каналов) PCI-E, Вы можете посмотреть самостоятельно на сайте производителя в спецификации чипсета.
Вывод по количеству линий PCI-E
Для обычного игрового ПК с 1й видеокартой, нет абсолютно никакой разницы в количестве линий PCI-E используемых по факту в материнской плате или видеокарте.
7505 дней упорной работы
Q: Что такое реальные и виртуальные фазы? Какие бывают реализации виртуальных фаз питания?
A: Реальное количество фаз определяет режим работы контроллера напряжения. Фазы можно считать виртуальными, если их больше, чем максимально поддерживаемое используемым контроллером напряжения.
Системы питания по степени "виртуальности" фаз можно поделить на три типа:
1. Традиционного типа, то есть без виртуальных фаз. Количество фаз в контроллере питания равно количеству драйверов, а также количеству дросселей и пар мосфетов. Тут все честно и прозрачно.
2. Параллельное соединение виртуальных фаз. Количество фаз в контроллере питания равно количеству драйверов, но на каждую реальную фазу приходится увеличенное количество дросселей и мосфетов, соединенных параллельно. Использование параллельного соединения можно отследить прозвонкой затворов у мосфетов между собой. Пример: 24-фазные материнские платы Gigabyte, за исключением GA-X58A-UD9.
3. Виртуальные фазы не соединены параллельно, а управляются каждая своим драйвером. Но реальное количество фаз, поддерживаемое контроллером напряжения, все равно меньше количества драйверов. В этом случае прозвонка затворов у мосфетов уже ничего не покажет. Пример: MSI Big Band XPower, MSI R5870 Lightning, MSI N480GTX Lightning
Q: Что такое LDO?
A: Low-dropout (LDO) regulator – микросхема, понижающая напряжение до нужного уровня, без использования фаз питания. Используется для формирования питающего напряжения на компонентах, не очень требовательных к качеству питания и не потребляющих большой ток. Часто применяется на материнских платах для питания южных мостов и на видеокартах для напряжения PCI-E Voltage (Vpcie, оно же PEXVDD).
Зачем материнской плате несколько фаз?
В современных пользовательских материнских платах используется от 4+2 фаз до 14+2 фаз у новейших моделей на базе системной логики Z 590 . При этом +2 фазы как правило идут для контроллера памяти, и часто находятся рядом с фазами ядра, но иногда они могут быть и вынесены в сторону.
- Напряжение на процессор подается импульсами. Чтоб добиться постоянного значения применяется технология сглаживания, которая подразумевает использование нескольких фаз. Каждая из линий работает таким образом, чтоб импульсы подаваемого напряжения шли со смещением. В результате на процессор попадает уже стабильное напряжение.
- Элементы одной фазы имеют ограничение по мощности, которое теоретически достигает 65 Вт. Это значение получается, если принять возможный максимум силы тока в 50 А и умножить его на энергопотребление производительного процессора 1,3 Вт. При этом мы не учли потери энергии на нагрев системы и ее КПД. Таким образом самая мощная фаза на практике не способна обеспечить бюджетный процессор с TDP 65 Вт. И именно увеличением фаз добиваются необходимого уровня напряжения.
- Использование нескольких фаз позволяет снизить нагрузку на каждую, что влечет за собой снижение рабочих температур цепи питания в целом. А, следовательно, элементы фаз медленнее деградируют, так достигается увеличение срока службы.
Q: Какие контроллеры напряжения используются на материнских платах и видеокартах? Где скачать документацию к ним? Сколько фаз они поддерживают? Какие контроллеры напряжения поддерживают управление через шину I2C или SMBus (например, для реализации программного вольтмода)?
A: Ответы на все эти вопросы вы найдете в этой таблице:
MSI N260GTX Lightning (non-reference)
MSI N275GTX Lightning (non-reference)
MSI R4890 Cyclone (non-reference)
ASUS ENGTS450 DirectCU TOP (non-reference)
Radeon HD6870 (reference)
GeForce GTX460 / GTX465 (reference)
Конечно, этот список далеко не полный .
Автор и Редакция выражает отдельную благодарность TiN за помощь по некоторым вопросам.
Дополнительные интерфейсы
Кроме видеовыходов, упомянутых выше, а также разъемов питания, на видеокарте есть и другие интерфейсы. Хотя некоторые из них уже перестали играть какую-либо роль - по крайней мере, для геймеров. Конфигурации Multi-GPU уже не поддерживаются ни производителями видеокарт, ни большинством игр. Но на GeForce RTX 3090 все же есть интерфейс NVLink. Он присутствует и на настольных видеокартах семейства RTX.
NVLink 3.0 позволяет соединять до 12 GPU друг с другом. Но в линейке видеокарт RTX поддерживаются только две видеокарты. С теми же A100 Tensor GPU поддерживаются до 12 ускорителей, скорость обмена составляет до 600 Гбайт/с. Подобная пропускная способность намного выше 31,5 Гбайт/с, которые дает PCIe 4.0 x16. Установленная видеопамять используется подключенными GPU совместно. В случае двух GeForce RTX 3090 с 24 Гбайт каждая объем общей видеопамяти составляет 48 Гбайт.
В дата-центрах числа уже другие. 16 A100 Tensor GPU с 80 Гбайт каждый дают в сумме 1,28 Тбайт быстрой памяти со скоростью доступа 600 Гбайт/с. За быструю передачу информации между GPU отвечает коммутатор NVLink, суммарная пропускная способность достигает 9,6 Тбайт/с.
Современные видеокарты имеют на борту сложную систему электропитания графического процессора. Во многом она похожа на систему питания центрального процессора на материнской плате.
Сердцем этой схемы является 3-х фазный ШИМ контроллер, управляемый программно. Если сказать точнее, то им можно управлять посредством оверклокингового софта. Подняв в программе значение напряжения на ГПУ мы можем разогнать графический процессор. Увеличив значение слишком много, можно спалить ГПУ :)
На рисунке ниже изображена схема преобразователя на 3-х транзисторах MOSFET и драйвере. Эти транзисторы n канальные, обладают малым сопротивлением в открытом канале Сток Исток . Мосфет транзисторы способны пропустить ток более 30 Ампер. Драйвером управляет ШИМ контроллер.
Микросхема драйвера имеет вход разрешения работы, служащий для блокировки преобразователя внешней схемой при перегрузке или перегреве видеокарты.
Графический процессор питается от 3-х преобразователей, входное напряжение на которых 12 Вольт а выходное 1.05 Вольт.
На скриншоте изображена осциллограмма 2-х "лучей" сигналов на входах (затворах) полевых транзисторов VT1 и VT4
Когда открыт верхний ключ, ток протекает через дроссель L1 в нагрузку. Когда микросхема драйвера выключает верхний ключ, он закрывается и через малый промежуток времени DT открываются нижние ключи и ток протекает через транзисторы VT4 и VT5 .
Время DT необходимо для исключения вероятности состояния одновременно открытых транзисторов верхнего и нижнего плеча. В этом случае произошел бы пробой верхнего. Это самая опасная ситуация - при этом 12 В пойдет в 1 Вольтовый ГПУ, вызвав его повреждение.
С каждого канала преобразователей снимается сигнал обратной связи, сообщающий ШИМ контроллеру о текущем уровне напряжения на выходе преобразователя.
При превышении заданной температуры , по сигналу с терморезистора, логическая схема отправляет в драйвер сигнал запрещения работы, и конвертер закрывает оба ключа, переходя в режим защиты.
Наиболее частые неисправности схемы питания процессора видеокарт - пробой одного или нескольких транзисторов, как следствие возможен выход из строя ГПУ , неисправность ШИМ контроллера.
При сборке настольного компьютера максимум внимания обычно уделяется процессору, видеокарте и оперативной памяти. В то время как материнская плата чаще всего выбирается по модели чипсета и цене. В редких случаях пользователи среднего звена обращают внимание на наличие встроенных модулей беспроводной сети и звуковой модуль Realtek.
Однако материнская плата – это платформа, которая должна обеспечить все необходимые условия работы для компонентов ПК и в первую очередь процессора. Поэтому ключевым моментом выбора материнской платы должны стать фазы питания процессора. Что это такое и какое количество является оптимальными расскажем в этой статье.
Кратко о подсистеме питания материнской платы
Не будем глубоко погружаться в электротехнику и постараемся кратко объяснить структуру подсистемы питания материнской платы.
Называется она Voltage Regulator Module, поэтому часто можно встретить аббревиатуру VRM. Это часть общей электрической цепи материнской платы, которая отвечает за снабжение процессора напряжением.
Ее задача – преобразование параметров поступающего в систему электрического тока, до значений, необходимых для стабильной работы центрального процессора .
Блок питания компьютера выдает напряжения 3,3В, 5В и 12В. Процессору среднего уровня производительности для работы требуется порядка 0,9 – 1,5В. Причем, в зависимости от нагрузки, это значение постоянно меняется в большую или меньшую сторону. VRM материнской платы преобразует 12 В в напряжение, требуемое процессору, и при этом контролирует уровень потребления и обеспечивает повышение параметров при работе под нагрузками или после разгона.
Рабочими элементами подсистемы питания являются:
- PWM-контроллер;
- Драйвер;
- MOSFET-транзистор;
- дроссель
- конденсатор.
Цепь из пяти этих элементов и называется фазой. Все фазы подсистемы работают синхронно, обеспечивая идентичные значения напряжения и силы тока. Именно сила тока является показателем производительности фазы питания. Значение силы тока одной фазы среднего сегмента пользовательских платформ обычно колеблется в пределах 20 – 30 А.
GDDR5, GDDR5X, GDDR6, HBM
Помимо GPU, важным компонентом видеокарты остается память, поскольку она должна как можно быстрее обеспечивать графический процессор данными. Данные на видеокарту поступают через интерфейс PCI Express, они загружаются в видеопамять, после чего к ним может обращаться GPU с пропускной способностью почти 1 Тбайт/с. С годами технологии памяти совершенствовались.
GDDR (Graphics Double Data Rate) остается важным стандартом памяти современных видеокарт помимо High Bandwidth Memory (HBM). Как и в случае оперативной памяти DDR на материнских платах, GDDR тоже прошла через несколько поколений. В случае памяти DDR (и GDDR) передача данных производится на подъеме и спаде тактового сигнала. Со сменой поколений пропускная способность памяти GDDR существенно увеличилась. Вместе с тем энергопотребление продолжало снижаться. Память GDDR по 256-битному интерфейсу дает пропускную способность 25,6 Гбайт/с. У GDDR6X она достигает 936 Гбайт/с, планируются и более быстрые варианты. Тактовые частоты с поколениями увеличились со 166 МГц до нынешних 2.000 МГц и выше.
Видеокарты NVIDIA GeForce RTX базируются на новой памяти GDDR6X производства Micron. Память GDDR6X работает примерно на тех же частотах, что и GDDR6, напряжения тоже сравнимы. Но отличия имеются, к ним мы вернемся чуть ниже.
За последние годы было несколько попыток перейти на память HBM на рынке видеокарт. Однако высокая себестоимость памяти HBM и соответствующего интерфейса привели к тому, что сегодня почти все видеокарты оснащаются GDDR. На серверном сегменте все иначе. NVIDIA предлагает архитектуру Ampere в сочетании с памятью HBM, а именно A100 Tensor GPU. Память HBM2 обеспечивает пропускную способность до 2 Тбайт/с, та же GDDR6X пока не дает больше 936 Гбайт/с.
Пропускная способность памяти - спецификация техническая. Она дополняется различными алгоритмами сжатия данных в памяти. Что позволяет как сэкономить доступное пространство в памяти, так и ускорить передачу данных. Например, уже несколько поколений GPU NVIDIA используют цветовую дельта-компрессию. NVIDIA уже внедрила шестое поколение подобной компрессии.
Важно понимать, что сжатие выполняется без потерь. Так что никакие данные не искажаются, и разработчикам не приходится адаптировать свои продукты каким-либо образом.
NVIDIA использует для сжатия памяти цветовую дельта-компрессию (Delta Color Compression). Она основана на хранении полной цветовой информации только о базовом пикселе, для остальных пикселей сохраняется разница с базовым (дельта). Для этой цели используется матрица 8x8 пикселей. Поскольку близко расположенные пиксели обычно мало отличаются по цвету, хранение для них разницы оказывается по объёму информации выгоднее, чем полного значения цвета. Поэтому в случае дельта-компрессии информация о пикселях занимает меньше места в памяти, также достигается экономия пропускной способности памяти. В качестве примера работы технологии можно привести полностью черный и белый блоки, которые будут храниться в памяти как или . Здесь можно сэкономить ресурсы, сохраняя только 0.0 или 1.0 в качестве значения.
NVIDIA улучшила процедуру определения сжимаемого контента. Ранее известное соотношение 2:1 теперь может использоваться чаще, то есть применяться к большему массиву данных. Появились и соотношения сжатия 4:1 и 8:1.
Сжатие цветовой информации позволяет увеличить эффективную пропускную способность памяти, поскольку физически ей приходится передавать меньше информации. Что повышает эффективность работы интерфейса памяти.
С контроллером GDDR6(X) NVIDIA продолжила использовать технологию определения и исправления ошибок Error Detection and Replay (EDR). Память GDDR6X работает на эффективной частоте порядка 1.200 МГц. Память становится все сложнее, частоты увеличиваются, поэтому ошибки неизбежны. По этой причине с памятью DDR5 была добавлена ECC для чипов. И подобная встроенная поддержка ECC вполне сравнима с EDR.
Через Error Detection and Replay определяются ошибки (Error Detection), после чего данные передаются повторно, пока ошибок не будет (Replay). Теперь ошибки передачи определяются на уровне контроллера памяти и не приводят к появлению артефактов. Для проверки целостности данных применяется алгоритм Cyclic Redundancy Check (CRC). Если данные будут повреждены при передаче, то контрольная сумма CRC не совпадет.
Без CRC или Error Detection and Replay на высоких частотах повышается риск возникновения ошибок и появления артефактов. Также есть риск краха драйвера или системы.
Благодаря Error Detection and Replay ошибки получается выявлять и исправлять. Но при дальнейшем разгоне можно выйти на уровень, когда пропускную способность далее увеличить уже не получается. Но до этого уровня "вылетов" не происходит, можно надеяться на безошибочную работу. Таким образом, EDR не только защищает целостность данных при обычной работе видеокарты, но и помогает разогнать память до предела возможностей.
Корпусировка GPU
Конечно, самый важный компонент видеокарты - это GPU. Но в данном случае подразумевается не просто кристалл на PCB (Printed Circuit Board), но корпусировка GPU. Упаковка GPU состоит из подложки, обычно тоже PCB, к которой кристалл крепится через массив шариков BGA (Ball Grid Array). Впрочем, многие GPU напрямую припаиваются к PCB видеокарты через BGA и без подложки. Опять же, здесь все зависит от корпусировки GPU.
Если посмотреть на типичную корпусировку GPU, то графический процессор будет расположен по центру, его окружают различные компоненты SMD, по большей части резисторы. Упаковка GPU припаивается к PCB видеокарты через BGA. В показанном примере видеопамять GDDR6(X) расположена вне корпусировки GPU, на видеокарте.
NVIDIA также выпускает A100 Tensor GPU с встроенной в корпусировку памятью HBM. В таком случае GPU и HBM расположены ближе и соединены подложкой. В подложке имеются горизонтальные и вертикальные проводники на разных слоях, которые и обеспечивают связь между GPU и HBM.
Преимущество HBM заключается в очень широком интерфейсе памяти, который обеспечивает высокий уровень пропускной способности. Но данный интерфейс возможен только через подложку, поскольку на чип памяти приходится 1.024 дорожек. С двумя или четырьмя чипами памяти количество дорожек пропорционально увеличивается и превышает 4.000. Производство подложки - процесс довольно трудоемкий и затратный, он обходится дороже, чем просто установка упаковки GPU через BGA на PCB видеокарты. Кроме того, производителю видеокарты уже недостаточно просто купить GPU и смонтировать его на видеокарту; в цепочке производства задействуются дополнительные компании, которые устанавливают GPU и HBM на подложку.
Собственно, в этом кроется одна из причин (за исключением доступности и цен самой HBM), почему память HBM сегодня устанавливается лишь на некоторые видеокарты. На данный момент NVIDIA использует HBM с соответствующей корпусировкой GPU для ускорителей A100 Tensor GPU. Здесь затраты играют уже не такую существенную роль, а приложения выигрывают от высокой доступной пропускной способности памяти.
Q: Какие ошибки допускают авторы обзоров при описании систем питания?
- Вместо того чтобы попытаться самостоятельно разобраться в системе питания, просто копируют информацию из "reviewers guide", из пресс-релизов, с сайта производителя, из других обзоров, не всегда соответствующую действительности.
- Последнее время все чаще можно встретить фразы типа "система питания построена по схеме X+Y" или даже "X+Y+Z". Это приводит к запутыванию читателей. Сначала они читают обзор видеокарты, где напряжение на GPU приплюсовано к напряжению на памяти, а затем, читая обзор материнской платы, думают, что там к напряжению Vcore тоже приплюсована память, а не напряжение на контроллере памяти встроенном в процессор. Чтобы избежать путаницы, лучше указывать раздельно к каким напряжениям относятся те или иные фазы. Единственный случай, когда уместно указание вида "X+Y" – это когда оба напряжения управляются одним и тем же контроллером (например, в системах питания процессоров AMD на материнских платах под Socket AM3/AM2+).
- Думают, что система питания северного моста обязательно должна быть рядом с северным мостом, а система питания памяти – рядом со слотами памяти и т.д. Это не всегда так. Да, чем короче длина проводников от системы питания до питаемого элемента, тем лучше. Но место на PCB ограничено и при нынешней очень высокой плотности компонентов, не всегда удается размещать все необходимое поблизости. Система питания северного моста может находиться, к примеру, между южным мостом и слотами памяти, а рядом с северным мостом не редко можно встретить систему питания встроенного контроллера памяти в процессоре.
- Не используют мультиметр для проверки своих предположений о принадлежности элементов системы питания к тому или иному напряжению. В некоторых случаях без мультиметра правильно определить количество используемых фаз бывает довольно сложно. Например, когда контролер напряжения поддерживает до 3-х фаз и на плате мы видим 3 дросселя, а при замерах мультиметром выясняется что фаз все-таки две, потому что третий дроссель стоит на входном напряжении (+12V VCC).
Q: Какие напряжения на видеокартах используют системы питания с 1 или более фаз?
A: Основные напряжения на видеокартах следующие:
- Напряжение на графическом процессоре – GPU Voltage (Vgpu). Возможные варианты – от 1-й фазы на low-end видеокартах до 16 виртуальных на топовых видеокартах.
- Общее напряжение на видеопамяти (когда Vddq равно Vdd) – memory voltage (Vmem). Обычно 1, 2 или 3 фазы. На простых видеокартах может стоять LDO.
- Раздельные напряжения на видеопамяти (когда Vddq не равно Vdd). Обычно по одной фазе на Vddq и Vdd.
- Напряжение на контроллере памяти (Vddci) – присутствует только на видеокартах, требующих использования отдельного напряжения для питания контроллера памяти в GPU (все верхние модели ATI Radeon, начиная с X1800/X1900/X1950). Обычно 1 или 2 фазы.
- Напряжения остальных компонентов (PCI-E Voltage, коммутаторы линий PCI-E, микросхемы NVIO, переходные мосты HSI и Rialto) практически никогда не используют что-то более сложное, чем LDO, поэтому их можно не рассматривать.
Что лучше: 6+2 или 8?
Не все процессорные фазы материнской платы питают ядра процессора. Обычно 2 предусмотрены для питания других элементов архитектуры CPU, например, графического ядра.
И опять-таки, в зависимости от маркетинговой компании производителя это может быть отражено в спецификации материнской платы различными способами:
6 + 2 – распределение фаз на ядра и другие компоненты CPU.
8 – это может быть, как число фаз только на ядра, так и их общее количество.
Подробнее этот момент можно уточнить в спецификации материнской платы на сайте производителя. Обязательно учитывайте его при выборе материнской платы.
Сколько фаз выбрать?
Подсистему питания выбирают в соответствие с производительностью процессора по следующей примерной схеме:
4 фазы – Intel Core i3 и AMD Ryzen 3.
6 – 8 фаз – Intel Core i3 и Core i5 с возможностью разгона, Core i7 без; AMD Ryzen 5 и Ryzen 7.
10 фаз и более – топовые модели процессоров Intel Core i9 и AMD Ryzen 9 с функцией разгона, а также Threadripper.
Выбор подсистемы процессорного питания материнской платы – это именно тот случай, когда лучше переплатить и взять устройство с запасом мощности, чем сэкономить и не позволить процессору реализовать свою производительность.
Сегодня мы постараемся рассказать о линиях PCI-E, как они влияют на производительность в играх. А так же о битности шины видеокарты, для чего она нужна и как влияет на производительность опять же в играх.
Линии PCI-Express, это интерфейс между всеми узлами материнской платы. Где видеочип Вашей карты использует до 16 линий при обмене данными с процессором. То есть, это канал с данными, пропускная способность которого, зависит, от количества этих линий.
Битность шины видеопамяти, это интерфейс, по которому видеочип обменивается данными с видеопамятью. То есть канал с пропускной способностью измеряемый в битности , если больше, то больше данный проходит за раз.
Сейчас на видеокартах используют все линия PCI-E (16), но в зависимости от чипсета материнской платы, они урезаются на самой плате, для удешевления. Так же на самых бюджетных видеокартах, производитель урезает PCI-E линия, сразу на них самих, но данные мы рассматривать не будем, там это ни на что не влияет в целом.
- Чипсеты материнский плат (Intel), разделяются не только возможностями разгона и дополнительных настроек системы, а так же в используемых линиях PCI-E. (пример: h чипсет, использует 6 линий PCI-E, b чипсет использует 12 линий PCI-E, Z чипсет, использует все доступные лини PCI-E - 24) Есть исключение это H470 чипсет, там 20 линий PCI-Express.
- Линия питания PCi-E идут не только на видеокарту, но и на любое устройство, что Вы решите использовать, будь то Wi-Fi в слоте PCI-E x1, м.2 накопитель, sata жесткий диск. Соответственно, чем больше Вы используете устройств в системе, тем меньше у Вас остается свободных линий PCI-E на видеокарту.
- К AMD данная статья подходит только для понимания битности шины, так как во всех материнских платах под AMD реализована поддержка 16 линий PCI-E, как минимум. Но от их уменьшения из-за множество доп. устройств в системе, они не застрахованы.
Читайте также: