Gk104 225 a2 какая видеокарта
ASUS уже довольно давно выпускает видеокарты в семействе "MARS". У NVIDIA сегодня нет видеокарты с двумя GPU на последнем поколении графических чипов, но тайваньский производитель решил устранить этот недостаток. Видеокарта MARS 760 вышла в семействе ROG (Republic of Gamers), она знаменует собой уже третье поколение графических ускорителей. Предыдущая видеокарта в семействе MARS, а именно ASUS MARS II, вышла в августе 2011, она базировалась на двух GPU GF110, которые использовались на GeForce GTX 580. Как можно догадаться по названию, ASUS ROG MARS 760 основывается не на двух high-end GPU, таких как GK110, а на графических процессорах GK104 с меньшим размером и энергопотреблением. Впервые они появились на видеокартах GeForce GTX 680, после чего NVIDIA использовала этот графический процессор для видеокарт семейства GeForce GTX 760. В любом случае, ASUS обещает, что видеокарта ROG MARS 760 обойдёт по производительности GeForce GTX Titan, а также будет при этом тише и холоднее благодаря превосходному кулеру. Мы решили проверить обещания компании на практике. Можно ли назвать ASUS ROG MARS 760 лучшим выбором для геймера?
Компания ASUS в прошлом не раз радовала интересными решениями в области графики, например, ту же видеокарту ROG ARES II (тест и обзор). Она представляет собой Radeon HD 7990, но видеокарта была выпущена до появления эталонной версии AMD на рынке. На эту видеокарту был установлен водоблок, цена составляла 1.425 евро в Европе, серия была ограничена и быстро разошлась. Если верить ASUS, сегодня все видеокарты ARES II распроданы. Упомянутая выше MARS II стоила не особо дешевле - около 1.000 евро в Европе. Новая видеокарта ASUS ROG MARS 760 обойдётся заметно дешевле - 620 евро. Впрочем, она не нацелена на экстремальную производительность любой ценой - видеокарта подойдёт тем энтузиастам, кто понимают смысл в производительности двух GPU.
Как мы уже упомянули выше, видеокарта ROG MARS 760 использует два GPU GK104. Ниже мы более подробно рассмотрим видеокарту.
Theoretical Performance
Pixel Rate 24.77 GPixel/s Texture Rate 99.07 GTexel/s FP32 (float) performance 2.378 TFLOPS FP64 (double) performance 99.07 GFLOPS (1:24)
Graphics Card
Release Date Jun 25th, 2013 Generation GeForce 700 Predecessor GeForce 600 Successor GeForce 900 Production End-of-life Launch Price 249 USD Bus Interface PCIe 3.0 x16 Reviews 140 in our database
Информация об архитектуре
ASUS ROG MARS 760 (MARS760-4GD5) | |
---|---|
Розничная цена | Узнать цену в России 620 евро в Европе |
Сайт производителя | ASUS |
Технические спецификации | |
GPU | 2x GK104 (GK104-225-A2) |
Техпроцесс | 28 нм |
Число транзисторов | 2x 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 1.006 МГц |
Тактовая частота GPU (частота Boost) | 1.072 МГц |
Частота памяти | 1.502 МГц |
Тип памяти | GDDR5 |
Объём памяти | 2x 2.048 Мбайт |
Ширина шины памяти | 2x 256 бит |
Пропускная способность памяти | 2x 192,3 Гбайт/с |
Версия DirectX | 11.0 |
Потоковые процессоры | 2x 1.152 |
Текстурные блоки | 2x 96 |
ROPs | 2x 32 |
Пиксельная скорость заполнения | 2x 32,3 Гпиксель/с |
SLI/CrossFire | SLI |
К каждому GPU по 256-битной шине подключены 2.048 Мбайт памяти GDDR5, которая работает на 1.502 МГц. Мы получаем пропускную способность памяти 192,3 Гбайт/с. Конечно, суммарный объём памяти составляет 4.096 Мбайт, но его не следует сравнивать с 3.072 Мбайт у видеокарты GeForce GTX 780. Из-за конфигурации SLI память распределяется по-другому. Количество текстурных блоков в обоих случаях составляет 192, но у видеокарты ROG MARS 760 мы получаем 64 конвейера растровых операций (ROP), у GTX 780 - всего 48 ROP. Впрочем, опять же, из-за конфигурации SLI не имеет большого смысла сравнивать спецификации напрямую, так как два GPU ведут себя иначе, чем один чип.
ASUS указывает для видеокарты ROG MARS 760 тепловой пакет TDP 340 Вт. Конечно, это в теории существенно выше, чем энергопотребление одной обычной видеокарты, а также превышает спецификацию ATX, указывающую максимальное энергопотребление 300 Вт. Но ASUS это не смущает. Вероятно, именно по этой причине NVIDIA после GeForce GTX 690 решила не выпускать видеокарты с двумя GPU на рынок.
Сравнение ASUS ROG MARS 760 с конкурентами | ||||
---|---|---|---|---|
Модель | ASUS ROG MARS 760 | AMD Radeon R9 290X | NVIDIA GeForce GTX 780 | NVIDIA GeForce GTX 780 Ti |
Розничная цена | Узнать цену в России 620 евро в Европе | от 20,8 тыс. рублей в России от 440 евро в Европе | от 17,8 тыс. рублей в России от 425 евро в Европе | от 25,0 тыс. рублей в России от 585 евро в Европе |
Сайт производителя | ASUS | AMD | NVIDIA | NVIDIA |
Технические спецификации | ||||
GPU | 2x GK104 (GK104-225-A2) | Hawaii XT | GK110 (GK110-300-A1) | GK110 (GK110-425-B1) |
Техпроцесс | 28 нм | 28 нм | 28 нм | 28 нм |
Число транзисторов | 2x 3,54 млрд. | 6,2 млрд. | 7,1 млрд. | 7,1 млрд. |
Тактовая частота GPU (базовая частота) | 1.006 МГц | - | 864 МГц | 876 МГц |
Тактовая частота GPU (частота Boost) | 1.072 МГц | 1.000 МГц | 902 МГц | 928 МГц |
Частота памяти | 1.502 МГц | 1.250 МГц | 1.502 МГц | 1.750 МГц |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Объём памяти | 2x 2.048 Мбайт | 4.096 Мбайт | 3.072 Мбайт | 3.072 Мбайт |
Ширина шины памяти | 2x 256 бит | 512 бит | 384 бит | 384 бит |
Пропускная способность памяти | 192,3 Гбайт/с | 320,0 Гбайт/с | 288,4 Гбайт/с | 336 Гбайт/с |
Версия DirectX | 11.0 | 11.2 | 11.1 | 11.1 |
Потоковые процессоры | 2x 1.152 | 2.816 | 2.304 | 2880 |
Текстурные блоки | 2x 96 | 176 | 192 | 240 |
ROPs | 2x 32 | 64 | 48 | 48 |
TDP | 340 Вт | > 250 Вт | 250 Вт | 250 Вт |
Сравнение с некоторыми видеокартами с одним GPU показывает, какой уровень производительности можно ожидать от ASUS ROG MARS 760. В следующей таблице мы приведем сравнение с двумя самыми быстрыми видеокартами с двумя GPU от AMD и NVIDIA на рынке.
Сравнение ASUS ROG MARS 760 с конкурентами | |||
---|---|---|---|
Модель | ASUS ROG MARS 760 | AMD Radeon HD 7990 | NVIDIA GeForce GTX 690 |
Розничная цена | Узнать цену в России 620 евро в Европе | от 20,7 тыс. рублей в России от 500 евро в Европе | от 33,4 тыс. рублей в России от 840 евро в Европе |
Сайт производителя | ASUS | AMD | NVIDIA |
Технические спецификации | |||
GPU | 2x GK104 (GK104-225-A2) | 2x Tahiti XT | 2x GK104 (GK104-355-A2) |
Техпроцесс | 28 нм | 28 нм | 28 нм |
Число транзисторов | 2x 3,54 млрд. | 2x 4,3 млрд. | 2x 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 1.006 МГц | 950 МГц | 915 МГц |
Тактовая частота GPU (частота Boost) | 1.072 МГц | 1.000 МГц | 1.019 МГц |
Частота памяти | 1.502 МГц | 1.500 МГц | 1.502 МГц |
Тип памяти | GDDR5 | GDDR5 | GDDR5 |
Объём памяти | 2x 2.048 Мбайт | 2x 3.072 Мбайт | 2x 2.048 Мбайт |
Ширина шины памяти | 2x 256 бит | 2x 384 бит | 2x 256 бит |
Пропускная способность памяти | 192,3 Гбайт/с | 2x 288 Гбайт/с | 2x 192,3 Гбайт/с |
Версия DirectX | 11.0 | 11.1 | 11.0 |
Потоковые процессоры | 2x 1.152 | 2x 2.048 | 2x 1.536 |
Текстурные блоки | 2x 96 | 2x 128 | 2x 128 |
ROPs | 2x 32 | 2x 32 | 2x 32 |
TDP | 340 Вт | 300 Вт | 300 Вт |
Видеокарты Radeon HD 7990 и GeForce GTX 690 обеспечивают большее количество потоковых процессоров, поэтому они будут играть в несколько иной лиге, чем ASUS ROG MARS 760. Но ASUS и позиционировала видеокарту соответствующим образом, в качестве конкурентов выбраны не две модели с двумя GPU, а некоторые видеокарты с одним GPU.
Скриншот GPU-Z видеокарты ASUS ROG MARS 760
Как можно видеть на скриншоте GPU-Z, технические спецификации подтверждаются, но ROG MARS утилитой распознается как конфигурация 760 SLI на двух видеокартах GeForce GTX 760 - технически это вполне разумно. В режиме Boost указана частота 1.072 МГц.
The GeForce GTX 760 was a performance-segment graphics card by NVIDIA, launched on June 25th, 2013. Built on the 28 nm process, and based on the GK104 graphics processor, in its GK104-225-A2 variant, the card supports DirectX 12. Even though it supports DirectX 12, the feature level is only 11_0, which can be problematic with newer DirectX 12 titles. The GK104 graphics processor is an average sized chip with a die area of 294 mm² and 3,540 million transistors. Unlike the fully unlocked GeForce GTX 680 Mac Edition, which uses the same GPU but has all 1536 shaders enabled, NVIDIA has disabled some shading units on the GeForce GTX 760 to reach the product's target shader count. It features 1152 shading units, 96 texture mapping units, and 32 ROPs. NVIDIA has paired 2,048 MB GDDR5 memory with the GeForce GTX 760, which are connected using a 256-bit memory interface. The GPU is operating at a frequency of 980 MHz, which can be boosted up to 1032 MHz, memory is running at 1502 MHz (6 Gbps effective).
Being a dual-slot card, the NVIDIA GeForce GTX 760 draws power from 2x 6-pin power connectors, with power draw rated at 170 W maximum. Display outputs include: 2x DVI, 1x HDMI 1.4a, 1x DisplayPort 1.2. GeForce GTX 760 is connected to the rest of the system using a PCI-Express 3.0 x16 interface. The card measures 241 mm in length, and features a dual-slot cooling solution. Its price at launch was 249 US Dollars.
Board Design
Slot Width Dual-slot Length 241 mm
9.5 inches TDP 170 W Suggested PSU 450 W Outputs 2x DVI
1x HDMI 1.4a
1x DisplayPort 1.2 Power Connectors 2x 6-pin Board Number P2004
Корпорация Nvidia сообщила официальные характеристики видеоускорителя GeForce GTX 760 для массового рынка, на который в Санта-Кларе возлагают большие надежды. Решение базируется на чипе GK104-225-A2, поддерживающем технологию динамического разгона GPU Boost 2.0.
Кристалл имеет только шесть рабочих блоков SMX из восьми и, соответственно, 1152 потоковых процессоров, 96 текстурных блоков, 32 блока растеризации и 256-битную шину памяти. Объем буферной ОЗУ типа GDDR5 составляет 2 ГБ, также ряд AIB-партнеров Nvidia выпустят модели GeForce GTX 760 c 4 ГБ GDDR5 на борту.
Видеокарты эталонного дизайна сочетают в себе двухслотовый кулер с центробежным вентилятором и небольшую печатную плату с двумя 6-контактными разъемами питания PCI-E Power и парой коннекторов SLI. Вывод изображения привычно осуществляется посредством разъемов Dual-Link DVI-I, Dual-Link DVI-D, HDMI 1.4a и DisplayPort 1.2.
(+)
Рекомендованные частоты GeForce GTX 760 равны 980(1033)/6008 МГц для ядра и памяти соответственно. Тепловой пакет составляет 170 Вт, как и у одного из флагманов предыдущего поколения GeForce GTX 670.
Рекомендованные цены эталонных моделей GTX 760: 2300 грн. для украинского рынка, 9000 руб. для российского и $250 для американского. Читайте на нашем сайте обзор «продвинутого» варианта GeForce GTX 760 — видеокарты MSI N760 TF 2GD5/OC.
NVIDIA продолжает представлять видеокарты в новой линейке GTX 700. После анонсов GeForce GTX 780 и GeForce GTX 770 сегодня настала очередь GeForce GTX 760. Пока что в планах NVIDIA других моделей не значится. К дате объявления новинки мы получили в нашу тестовую лабораторию четыре модели видеокарт GeForce GTX 760 в дополнение к эталонной версии. Все четыре розничные видеокарты отличаются не только тактовыми частотами, но и собственными системами охлаждения.
Видеокарта GeForce GTX 780 открыла геймерам совершенно новый сегмент производительности, а новая видеокарта GeForce GTX 770 технически базировалась на GeForce GTX 680, поэтому нам будет интересно посмотреть, на какие позиции производительности претендует NVIDIA GeForce GTX 760, против какой видеокарты AMD была выставлена новинка.
Перед тем, как мы перейдём к рассмотрению разных моделей GeForce GTX 760 и нашему расширенному тестовому пакету, позвольте более внимательно рассмотреть архитектуру нового графического процессора (в эталонной версии).
Relative Performance
Graphics Processor
GPU Name GK104 GPU Variant GK104-225-A2 Architecture Kepler Foundry TSMC Process Size 28 nm Transistors 3,540 million Die Size 294 mm²
Memory
Clock Speeds
Сравнение розничных версий видеокарт
Сравнение розничных версий видеокарт | ||
---|---|---|
Модель | ASUS GeForce GTX 760 DirectCU II OC (GTX760-DC2OC-2GD5) | EVGA GeForce GTX 760 Superclocked ACX (02G-P4-2765) |
Розничная цена | - | - |
Сайт производителя | ASUS | EVGA |
Технические спецификации | ||
GPU | GK104 (GK104-225-A2) | GK104 (GK104-225-A2) |
Техпроцесс | 28 нм | 28 нм |
Число транзисторов | 3,54 млрд. | 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 1006 МГц | 1072 МГц |
Тактовая частота GPU (частота Boost) | 1072 МГц | 1137 МГц |
Частота памяти | 1502 МГц | 1502 МГц |
Тип памяти | GDDR5 | GDDR5 |
Объём памяти | 2048 Мбайт | 2048 Мбайт |
Ширина шины памяти | 256 бит | 256 бит |
Пропускная способность памяти | 192,3 Гбайт/с | 192,3 Гбайт/с |
Версия DirectX | 11.0 | 11.0 |
Потоковые процессоры | 1152 (1D) | 1152 (1D) |
Текстурные блоки | 96 | 96 |
Конвейеры растровых операций (ROP) | 32 | 32 |
Сравнение розничных версий видеокарт | ||
---|---|---|
Модель | Inno3D iChill GeForce GTX 760 (C760-1SDN-E5DSX) | Palit GeForce GTX 770 Jetstream (NE5X760H1042-1042J) |
Розничная цена | - | - |
Сайт производителя | www.inno3d.com | www.palit.biz |
Технические спецификации | ||
GPU | GK104 (GK104-225-A2) | GK104 (GK104-225-A2) |
Техпроцесс | 28 нм | 28 нм |
Число транзисторов | 3,54 млрд. | 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 1059 МГц | 1072 МГц |
Тактовая частота GPU (частота Boost) | 1124 МГц | 1137 МГц |
Частота памяти | 1553 МГц | 1550 МГц |
Тип памяти | GDDR5 | GDDR5 |
Объём памяти | 2048 Мбайт | 2048 Мбайт |
Ширина шины памяти | 256 бит | 256 бит |
Пропускная способность памяти | 198,8 Гбайт/с | 198,4 Гбайт/с |
Версия DirectX | 11.0 | 11.0 |
Потоковые процессоры | 1152 (1D) | 1152 (1D) |
Текстурные блоки | 96 | 96 |
Конвейеры растровых операций (ROP) | 32 | 32 |
NVIDIA специально для анонса GeForce GTX 760 приготовила видеоролик, которым мы хотим поделиться:
Ниже мы рассмотрим отдельные видеокарты, и начнём с ASUS GeForce GTX 760 DirectCU II OC.
< >Тест и обзор: NVIDIA GeForce GTX 760 - четыре видеокарты от ASUS, EVGA, Inno3D и Palit
ASUS GeForce GTX 760 DirectCU II OC (GTX760-DC2OC-2GD5)
На конференции SC12 Supercomputing в Солт-Лейк-Сити NVIDIA представила вычислительные карты для серверов и рабочих станций Tesla K20 и K20X на основе GPU GK110. Две версии, о которых мы поговорим ниже чуть подробнее, и объясняют путаницу, которая существовала в последние недели вокруг Tesla K20. Изначально поставщик стоечных серверов на GPU сообщил, что карты NVIDIA Tesla K20 будут использовать GK110 с 13 кластерами SMX, каждый со 192 ядрами CUDA, что дает 2496 ядер CUDA в общей сложности. Вскоре на открытии суперкомпьютера Titanium было указано на 2688 ядер CUDA, что указывает на 14 кластеров SMX. И существование двух версий карт объясняет подобный дуализм.
Tesla K20 на основе GK110
Tesla K20X - новая high-end модель для вычислений на GPU, ускоритель ориентирован исключительно на серверы. Чуть менее мощная карта Tesla K20 нацелена и на серверы, и на рабочие станции.
GF110 Tesla M2090 | GK104 Tesla K10 | GK110 Tesla K20 | GK110 Tesla K20X | |
Техпроцесс | 40 нм | 28 нм | 28 нм | 28 нм |
Число транзисторов | 3 млрд. | 2x 3,54 млрд. | 7,1 млрд. | 7,1 млрд. |
Техпроцесс | 530 мм² | 294 мм² | предполож. 600 мм² | предполож. 600 мм² |
TDP | 225 Вт | 225 Вт | 225 Вт | 235 Вт |
Тактовая частота GPU | 1300 МГц | 2x 745 МГц | - МГц | - МГц |
Тактовая частота памяти | 463 МГц | 625 МГц | - МГц | - МГц |
Тип памяти | GDDR5-ECC | GDDR5-ECC | GDDR5-ECC | GDDR5-ECC |
Объём памяти | 6144 Мбайт | 8192 Мбайт | 5120 Мбайт | 6144 Мбайт |
Ширина шины памяти | 384 бит | 256 бит | 320 бит | 384 бит |
Пропускная способность памяти | 177 Гбайт/с | 2x 160 Гбайт/с | 208 Гбайт/с | 250 Гбайт/с |
Потоковые процессоры | 512 (1D) | 2x 1536 (1D) | 2496 (1D) | 2688 (1D) |
Кэш L1 | 64 кбайт | 64 кбайт | 64 кбайт | 64 кбайт |
Кэш L2 | 768 кбайт | 512 кбайт | 1,5 Мбайт | 1,5 Мбайт |
ECC | Память и кэши | Только память | Память и кэши | Память и кэши |
FP64 | 1/2 FP32 | 1/24 FP32 | 1/3 FP32 | 1/3 FP32 |
Одиночная точность | 1,33 TFlops | 4,58 TFlops | 3,52 TFlops | 3,95 TFlops |
Двойная точность | 0,66 TFlops | 0,19 TFlops | 1,17 TFlops | 1,31 TFlops |
Огромный прирост производительности в вычислениях с двойной точностью и скромный прирост производительности с одинарной точностью можно объяснить смещением акцента с FP32 на FP64. Графический процессор GK110 стал первым чипом NVIDIA, ориентированным полностью на профессиональный рынок и сферы HPC (High Performance Computing). Карта Tesla K10 базируется на двух GPU GK104, которые относятся к первому поколению "Kepler" и ориентированы, в том числе, и на GPU GeForce, а в рендеринге производительность с одинарной точность играет решающую роль. Рейтинг производительности с одинарной точностью по отношению к двойной точности был снижен с 1/2 до 1/24. Наконец, у GK104 технологией ECC защищается только оперативная память, но не кэши.
Диаграмма GK110
Для получения более высокой производительности с двойной точностью, NVIDIA установила 64 ядра Floating Point на кластер SMX, у GK104 использовалось только восемь подобных ядер на кластер. Вместе с увеличением количества кластеров данный шаг привел к значительному приросту по производительности с двойной точностью. NVIDIA также опирается на свою скалярную архитектур "Superscalar Dispatch Method", которая появилась в GF104 и гарантирует более защищённые от ошибок вычисления. Эта архитектура опирается на параллелизм на уровне потоков Thread Level Parallelism (TLP) и параллелизм на уровне инструкций Instruction Level Parallelism (ILP).
Диаграмма кластера GK110 SMX
Производительность вычислений с двойной точностью была увеличения некоторыми изменениями в регистрах. Число регистров на кластеры SMX осталось прежним 65 536 по сравнению с GK104, но на поток GK110 обеспечивает доступ к 255 регистрам - в отличие от только 63 у GK104.
Как мы уже упоминали, интерфейс памяти стал шире, теперь он состоит из шести 64-битных блоков, которые вместе обеспечивают 384-битный интерфейс. В отличие от GK104, технология ECC защищает не только видеопамять, но и кэши L1 и L2. Поскольку определение ошибок подразумевает выполнение некоторых дополнительных вычислений, NVIDIA снизила вычислительные потери благодаря внутренней оптимизации до 66 процентов.
Hyper-Q и динамический параллелизм остались и в GK110.
Hyper-Q:
В случае архитектуры "Fermi" GPU могли работать только с одной рабочей очередью команд и данных, но в случае "Kepler" ситуация уже отличается.
Hyper-Q в сравнении
Одновременно с GPU "Kepler" могут работать до 32 физических ядер CPU. Конечно, данное ограничение не присутствует на программном уровне в интерфейсах DirectX 11, и несколько потоков могут выполняться одновременно, но передача данных и команд на GPU всё равно выполнялась последовательно. Благодаря поддержке Hyper-Q в будущем можно будет передавать данные параллельно.
Последовательное выполнение команд без Hyper-Q
Без поддержки Hyper-Q данные и команды передаются последовательно, загрузка GPU в данном случае не является оптимальной.
Выполнение команд с Hyper-Q
С помощью Hyper-Q данные и команды 32 физических ядер передаются одновременно. Это приводит не только к лучшему использованию GPU, но и к тому, что выполненные вычисления могут обрабатываться быстрее.
Кроме того, теперь множество GPU в системе могут напрямую связываться друг с другом. Технология "GPU Direct" как раз позволяет GPU "Kepler" связываться друг с другом даже по сети - обращение к CPU и памяти теперь уже не требуется.
Dynamic Parallelism:
Команды и данные, которые поставляются на GPU, могут быть взаимозависимыми (например, если расчеты зависят от результатов других вычислений), таким образом, части разных потоков могут блокироваться от выполнения на GPU некоторый промежуток времени. NVIDIA постаралась внести и улучшения обработки подобных ситуаций в интерфейс CUDA.
Dynamic Parallelism
Технология Dynamic Parallelism на GPU может решать подобные проблемы зависимости. Впрочем, от программистов тоже требуются усилия, поскольку им следует учитывать неравномерности обработки GPU и запросы из памяти. Если созданные потоки превысят возможности доступной памяти GPU, то будет проводиться обращение через шину памяти PCI Express, что может вновь замедлить весь процесс.
Dynamic Parallelism
GPU самостоятельно определяет, в каких пропорциях он будет допускать существование зависимостей. Всё это позволит Nvidia избежать сценариев, ограничивающих производительность.
Эффективность энергопотребления:
В случае NVIDIA Tesla K20 и K20X мы получаем отличные результаты по эффективности энергопотребления. Если вы взглянете на список Green500, в котором компьютеры приведены по рейтингу эффективности энергопотребления, то на одном из первых мест находится BlueGene/Q с 16 ядрами на 1,6 ГГц и вычислительной производительностью около 2100 мегафлопов на ватт. В случае системы NVIDIA Tesla K20X мы получаем около 2250 мегафлопов на ватт. А цена такого решения ещё и в четыре раза ниже.
Использование в суперкомпьютере Titan:
Вычислительные ускорители Tesla K20X используются в суперкомпьютере Titan в Окриджской национальной лаборатории (штат Теннеси, США). Установленная система достигает пиковой производительности 27 петафлопов. Суперкомпьютер состоит из 18 688 GPU NVIDIA Tesla K20X и такого же количества 16-ядерных процессоров AMD (Opteron 6274). Как можно догадаться, Titan состоит из 18 688 узлов, которые объединены в 200 ячеек. На каждый узел доступно 32 Гбайт памяти, что даёт общую ёмкость оперативной памяти 710 терабайт.
Конкуренты:
Вчера утром AMD объявила новые вычислительные ускорители FirePro S10000 на основе двух GPU Tahiti Pro. Мы опубликовали новость и сравнение теоретической производительности, но в тот момент карты K20X и K20 ещё не были официально объявлены.
Модель | AMD FirePro S10000 | NVIDIA Tesla K20X | NVIDIA Tesla K20 | NVIDIA Tesla K10 | NVIDIA Tesla M2090 |
Одиночная точность | 5,91 TFlops | 3,95 TFlops | 3,52 TFlops | 4,58 TFLops | 1,33 TFlops |
Двойная точность | 1,48 TFlops | 1,31 TFlops | 1,17 TFlops | 0,19 TFlops | 0,67 TFlops |
По чистой теоретической производительности вычислительный ускоритель AMD FirePro S10000 обгоняет конкурентов NVIDIA, будь то GK104 или GK110. Но следует учитывать, что AMD для FirePro S10000 указывает максимальное энергопотребление 335 Вт, в то время как NVIDIA K20X отличается энергопотреблением всего 235 Вт. Кроме того, NVIDIA нацелила GK104 и GK110 на другие сферы применения, что можно видеть по соотношениям производительности с одинарной и двойной точностью.
Информация об архитектуре
ASUS ROG MARS 760 (MARS760-4GD5) | |
---|---|
Розничная цена | Узнать цену в России 620 евро в Европе |
Сайт производителя | ASUS |
Технические спецификации | |
GPU | 2x GK104 (GK104-225-A2) |
Техпроцесс | 28 нм |
Число транзисторов | 2x 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 1.006 МГц |
Тактовая частота GPU (частота Boost) | 1.072 МГц |
Частота памяти | 1.502 МГц |
Тип памяти | GDDR5 |
Объём памяти | 2x 2.048 Мбайт |
Ширина шины памяти | 2x 256 бит |
Пропускная способность памяти | 2x 192,3 Гбайт/с |
Версия DirectX | 11.0 |
Потоковые процессоры | 2x 1.152 |
Текстурные блоки | 2x 96 |
ROPs | 2x 32 |
Пиксельная скорость заполнения | 2x 32,3 Гпиксель/с |
SLI/CrossFire | SLI |
К каждому GPU по 256-битной шине подключены 2.048 Мбайт памяти GDDR5, которая работает на 1.502 МГц. Мы получаем пропускную способность памяти 192,3 Гбайт/с. Конечно, суммарный объём памяти составляет 4.096 Мбайт, но его не следует сравнивать с 3.072 Мбайт у видеокарты GeForce GTX 780. Из-за конфигурации SLI память распределяется по-другому. Количество текстурных блоков в обоих случаях составляет 192, но у видеокарты ROG MARS 760 мы получаем 64 конвейера растровых операций (ROP), у GTX 780 - всего 48 ROP. Впрочем, опять же, из-за конфигурации SLI не имеет большого смысла сравнивать спецификации напрямую, так как два GPU ведут себя иначе, чем один чип.
ASUS указывает для видеокарты ROG MARS 760 тепловой пакет TDP 340 Вт. Конечно, это в теории существенно выше, чем энергопотребление одной обычной видеокарты, а также превышает спецификацию ATX, указывающую максимальное энергопотребление 300 Вт. Но ASUS это не смущает. Вероятно, именно по этой причине NVIDIA после GeForce GTX 690 решила не выпускать видеокарты с двумя GPU на рынок.
Сравнение ASUS ROG MARS 760 с конкурентами | ||||
---|---|---|---|---|
Модель | ASUS ROG MARS 760 | AMD Radeon R9 290X | NVIDIA GeForce GTX 780 | NVIDIA GeForce GTX 780 Ti |
Розничная цена | Узнать цену в России 620 евро в Европе | от 20,8 тыс. рублей в России от 440 евро в Европе | от 17,8 тыс. рублей в России от 425 евро в Европе | от 25,0 тыс. рублей в России от 585 евро в Европе |
Сайт производителя | ASUS | AMD | NVIDIA | NVIDIA |
Технические спецификации | ||||
GPU | 2x GK104 (GK104-225-A2) | Hawaii XT | GK110 (GK110-300-A1) | GK110 (GK110-425-B1) |
Техпроцесс | 28 нм | 28 нм | 28 нм | 28 нм |
Число транзисторов | 2x 3,54 млрд. | 6,2 млрд. | 7,1 млрд. | 7,1 млрд. |
Тактовая частота GPU (базовая частота) | 1.006 МГц | - | 864 МГц | 876 МГц |
Тактовая частота GPU (частота Boost) | 1.072 МГц | 1.000 МГц | 902 МГц | 928 МГц |
Частота памяти | 1.502 МГц | 1.250 МГц | 1.502 МГц | 1.750 МГц |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Объём памяти | 2x 2.048 Мбайт | 4.096 Мбайт | 3.072 Мбайт | 3.072 Мбайт |
Ширина шины памяти | 2x 256 бит | 512 бит | 384 бит | 384 бит |
Пропускная способность памяти | 192,3 Гбайт/с | 320,0 Гбайт/с | 288,4 Гбайт/с | 336 Гбайт/с |
Версия DirectX | 11.0 | 11.2 | 11.1 | 11.1 |
Потоковые процессоры | 2x 1.152 | 2.816 | 2.304 | 2880 |
Текстурные блоки | 2x 96 | 176 | 192 | 240 |
ROPs | 2x 32 | 64 | 48 | 48 |
TDP | 340 Вт | > 250 Вт | 250 Вт | 250 Вт |
Сравнение с некоторыми видеокартами с одним GPU показывает, какой уровень производительности можно ожидать от ASUS ROG MARS 760. В следующей таблице мы приведем сравнение с двумя самыми быстрыми видеокартами с двумя GPU от AMD и NVIDIA на рынке.
Сравнение ASUS ROG MARS 760 с конкурентами | |||
---|---|---|---|
Модель | ASUS ROG MARS 760 | AMD Radeon HD 7990 | NVIDIA GeForce GTX 690 |
Розничная цена | Узнать цену в России 620 евро в Европе | от 20,7 тыс. рублей в России от 500 евро в Европе | от 33,4 тыс. рублей в России от 840 евро в Европе |
Сайт производителя | ASUS | AMD | NVIDIA |
Технические спецификации | |||
GPU | 2x GK104 (GK104-225-A2) | 2x Tahiti XT | 2x GK104 (GK104-355-A2) |
Техпроцесс | 28 нм | 28 нм | 28 нм |
Число транзисторов | 2x 3,54 млрд. | 2x 4,3 млрд. | 2x 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 1.006 МГц | 950 МГц | 915 МГц |
Тактовая частота GPU (частота Boost) | 1.072 МГц | 1.000 МГц | 1.019 МГц |
Частота памяти | 1.502 МГц | 1.500 МГц | 1.502 МГц |
Тип памяти | GDDR5 | GDDR5 | GDDR5 |
Объём памяти | 2x 2.048 Мбайт | 2x 3.072 Мбайт | 2x 2.048 Мбайт |
Ширина шины памяти | 2x 256 бит | 2x 384 бит | 2x 256 бит |
Пропускная способность памяти | 192,3 Гбайт/с | 2x 288 Гбайт/с | 2x 192,3 Гбайт/с |
Версия DirectX | 11.0 | 11.1 | 11.0 |
Потоковые процессоры | 2x 1.152 | 2x 2.048 | 2x 1.536 |
Текстурные блоки | 2x 96 | 2x 128 | 2x 128 |
ROPs | 2x 32 | 2x 32 | 2x 32 |
TDP | 340 Вт | 300 Вт | 300 Вт |
Видеокарты Radeon HD 7990 и GeForce GTX 690 обеспечивают большее количество потоковых процессоров, поэтому они будут играть в несколько иной лиге, чем ASUS ROG MARS 760. Но ASUS и позиционировала видеокарту соответствующим образом, в качестве конкурентов выбраны не две модели с двумя GPU, а некоторые видеокарты с одним GPU.
Скриншот GPU-Z видеокарты ASUS ROG MARS 760
Как можно видеть на скриншоте GPU-Z, технические спецификации подтверждаются, но ROG MARS утилитой распознается как конфигурация 760 SLI на двух видеокартах GeForce GTX 760 - технически это вполне разумно. В режиме Boost указана частота 1.072 МГц.
The GeForce GTX 760 was a performance-segment graphics card by NVIDIA, launched on June 25th, 2013. Built on the 28 nm process, and based on the GK104 graphics processor, in its GK104-225-A2 variant, the card supports DirectX 12. Even though it supports DirectX 12, the feature level is only 11_0, which can be problematic with newer DirectX 12 titles. The GK104 graphics processor is an average sized chip with a die area of 294 mm² and 3,540 million transistors. Unlike the fully unlocked GeForce GTX 680 Mac Edition, which uses the same GPU but has all 1536 shaders enabled, NVIDIA has disabled some shading units on the GeForce GTX 760 to reach the product's target shader count. It features 1152 shading units, 96 texture mapping units, and 32 ROPs. NVIDIA has paired 2,048 MB GDDR5 memory with the GeForce GTX 760, which are connected using a 256-bit memory interface. The GPU is operating at a frequency of 980 MHz, which can be boosted up to 1032 MHz, memory is running at 1502 MHz (6 Gbps effective).
Being a dual-slot card, the NVIDIA GeForce GTX 760 draws power from 2x 6-pin power connectors, with power draw rated at 170 W maximum. Display outputs include: 2x DVI, 1x HDMI 1.4a, 1x DisplayPort 1.2. GeForce GTX 760 is connected to the rest of the system using a PCI-Express 3.0 x16 interface. The card measures 241 mm in length, and features a dual-slot cooling solution. Its price at launch was 249 US Dollars.
Render Config
Информация об архитектуре
Как мы уже упомянули, у GeForce GTX 760 нет прямого предшественника в семействе GTX 600. Видеокарта базируется на GPU GK104, но в данном случае используется полностью новая версия чипа. У него будут активны три или четыре кластера GPC (Graphics Processing Clusters). В зависимости от выхода годных кристаллов, шесть кластеров SMX будут браться на основе трёх или четырёх GPC. То есть мы получаем схожий подход с GeForce GTX 780, где тоже встречается разное распределение кластеров GPC и SMX. Во всех случаях мы получаем шесть кластеров SMX, 1152 потоковых процессоров CUDA, 96 текстурных блоков и 32 конвейера растровых операций (ROP).
Базовая тактовая частота GPU выставлена NVIDIA на уровне 980 МГц. Но благодаря технологии GPU Boost она может увеличиваться, как минимум, до 1033 МГц. 2 Гбайт памяти GDDR5 работают на частоте 1502 МГц. 256-битная шина памяти обеспечивает пропускную способность 192,3 Гбайт/с. Также NVIDIA предусматривает у эталонной версии два 6-контактных гнезда дополнительного питания. Тепловой пакет новой видеокарты составляет 170 Вт.
Позвольте сказать пару слов о технологии GPU Boost 2.0. NVIDIA указывает частоту Boost на уровне 1033 МГц, но это минимальная планка, в реальности эталонная видеокарта работает на более высоких тактовых частотах. Мы получали уровень до 1150 МГц, но при этом видеокарта довольно быстро добирается до температуры GPU 82 °C, после чего начинает сбрасывать частоты.
NVIDIA GeForce GTX 760 | |
---|---|
Розничная цена | около 240 евро в Европе около 9 тыс. рублей в России |
Сайт производителя | NVIDIA |
Технические спецификации | |
GPU | GK104 (GK104-225-A2) |
Техпроцесс | 28 нм |
Число транзисторов | 3,54 млрд. |
Тактовая частота GPU (базовая частота) | 980 МГц |
Тактовая частота GPU (частота Boost) | 1033 МГц |
Частота памяти | 1502 МГц |
Тип памяти | GDDR5 |
Объём памяти | 2048 Мбайт |
Ширина шины памяти | 256 бит |
Пропускная способность памяти | 192,3 Гбайт/с |
Версия DirectX | 11.0 |
Потоковые процессоры | 1152 (1D) |
Текстурные блоки | 96 |
Конвейеры растровых операций (ROP) | 32 |
Пиксельная скорость заполнения | 33,9 Гпиксель/с |
TDP | 170 Вт |
SLI/CrossFire | SLI |
Другие розничные образцы видеокарт в наших тестах отличаются от эталонной модели, в том числе, и тактовыми частотами. Ниже мы приведем сравнительную таблицу видеокарт, после чего рассмотрим каждую модель по отдельности.
Читайте также: