Тип графического процессора gp108
Две бюджетные видеокарты без разъема дополнительного питания приносят архитектуру Pascal в диапазон $109–139. В отличие от старших GPU, графический процессор GP107 производится по нормам 14 нм FinFET на мощностях Samsung — посмотрим, как это повлияло на частоты и энергопотребление в сравнении с ядром AMD Polaris 11, построенным на идентичном техпроцессе
25 октября поступили в продажу две модели видеоускорителей NVIDIA с архитектурой Pascal для бюджетных игровых ПК. Если во времена Maxwell NVIDIA начинала внедрение новой архитектуры с нижнего ценового сегмента (а AMD в Polaris начала с середины), то семейство Pascal разворачивается в классической последовательности — от флагманского продукта к наиболее доступному.
Предыдущие анонсы NVIDIA в этом году позволили составить полное представление о том, что собой представляет архитектура Pascal. На данный момент NVIDIA наслаждается отсутствием конкуренции в высшем ценовом диапазоне, поскольку AMD еще не выпустила равного соперника на базе техпроцесса нового поколения для GeForce GTX 1070/1080. А видеокарта NVIDIA TITAN X позволяет представить, как будет выглядеть новый флагманский продукт тогда, когда NVIDIA сочтет нужным расширить семейство игровых ускорителей в сторону еще большей производительности.
Среднюю категорию по цене и быстродействию в семействе Pascal образуют GeForce GTX 1060 и GTX 1060 3 Гбайт (последний мы рассматриваем отдельно, так как он отличается не только объемом RAM, но и конфигурацией графического ядра). Здесь AMD сумела представить альтернативный выбор в виде ускорителей Radeon RX 470 и RX 480 на чипе Polaris 10, обладающих адекватным соотношением производительности и цены.
Ну а новейшие GeForce GTX 1050 и GTX 1050 Ti представляют собой видеокарты для игровых ПК начального уровня и HTPC (Home Theater PC). На первый взгляд они выглядят скромным дополнением к линейке Pascal, не заслуживающим столь пристального внимания, которое снискали их старшие предшественники. Однако не стоит пренебрегать новинками лишь только потому, что они не имеют ценности в глазах хардкорных геймеров. GTX 1050/1050 Ti — важное явление в своем роде как с практической, так и с теоретической точки зрения.
Младшие видеокарты на базе Pascal заполняют нишу, которая осталась вакантной в линейке GeForce 900, и с технической точки зрения являются наследниками скорее GeForce GTX 750/750 Ti (GPU GM107), нежели GeForce GTX 950. Хотя эти видеокарты формально относятся к одному классу, NVIDIA не выпустила графического процессора на замену GM107 в 900-й линейке, основанной на архитектуре Maxwell второго поколения (чипы GM2xx). Как следствие, GTX 950 на базе частично заблокированного чипа GM206 не соответствует энергоэффективности GTX 750 Ti, что помешало создать столь же компактные видеокарты, лишенные разъема дополнительного питания. Таким образом, GTX 1050/1050 Ti, в отличие от прочих моделей 10-й серии с архитектурной точки зрения представляет собой шаг не в одно, а в полтора поколения. Если же прибавить к возросшей производительности на ватт, которую обеспечил техпроцесс следующего поколения, новые мультимедийные возможности Pascal (аппаратный кодек HEVC, видеоинтерфейсы HDMI 2.0b и DisplayPort 1.3/1.4), то новинки начнут выглядеть весьма перспективно.
Есть и второй аспект, который делает GTX 1050/1050 Ti интригующим объектом исследования. В долгожданном переходе графических процессоров с нормы 28 нм на техпроцесс 14/16 нм мы увидели, как разработчики микросхем, которые в прошлые годы неизменно заказывали производство на фабрике TSMC, пошли разными путями. NVIDIA продолжила пользоваться услугами TSMC для процессоров Pascal по технологии 16 нм FinFET, в то время как AMD переметнулась к GlobalFoundries, лицензировавшей технологию 14 нм FinFET у Samsung.
Теперь настал конец и многолетнему эксклюзивному сотрудничеству NVIDIA c TSMC, ведь в документации на GTX 1050/1050 Ti указано, что чип GP107 выполнен по норме 14 нм FinFET. Как известно, в последний раз NVIDIA прибегла к услугам другого производителя в 2003 году — для производства чипов NV3x из семейства карт GeForce FX. Официально компания не раскрывает имя своего подрядчика, но, согласно сторонним источникам, им стал Samsung. К слову, пусть вас не смущает слово TAIWAN в маркировке GPU (как и полное совпадение формата, в котором кодируется период производства и степпинг чипа). Да, фабрика Samsung с технологией 14 нм FinFET находится в Техасе, США, но, когда NVIDIA выпускала GPU серии NV3x на американской фабрике IBM, чипы были промаркированы как корейские. Видимо, NVIDIA просто собирает GPU в корпуса либо делает с ними что-либо еще на территории Тайваня.
Как бы то ни было, по «энергетическим» характеристикам GP107 может отличаться от своих старших собратьев, выпущенных TSMC. Кроме того, результаты тестирования GTX 1050/1050 Ti приблизят нас к ответу на вопрос, почему новейшие графические процессоры AMD выступили столь бледно в плане частотного потенциала и производительности на ватт. В какой степени разница по этим параметрам между Pascal и Polaris обусловлена особенностями архитектуры, а в какой — производственным фактором? Впрочем, если сделать поправку на то, что две компании могли воплотить техпроцесс 14 нм FinFET по-разному, то проверка GP107 в деле сможет снять подозрения лишь с технологии как таковой, а не с фабрики GlobalFoundries в штате Нью-Йорк, США, которая занимается выпуском соответствующих микросхем, или инженеров Advanced Micro Devices.
GP107 в полной мере воплощает принципы, заложенные в архитектуре Pascal применительно к GPU игрового класса (в отличие от GP100, имеющего свои особенности). От старших чипов — GP106, GP104, GP102 — он отличается лишь числом вычислительных блоков и объемом кешей различного назначения.
Логическая схема GP107 включает два GPC (Graphics Processing Cluster), каждый из которых состоит из блока Raster Engine, выполняющего первоначальные стадии рендеринга (определение граней полигонов, проекция и отсечение невидимых пикселов) и трех SM (Stream Multiprocessor). Каждый из последних, в свою очередь, содержит геометрический движок PolyMorph Engine, 128 32-битных ядер CUDA, 4 64-битных ядра CUDA, 8 текстурных модулей и секцию кеша L1. Как и другие игровые GPU в семействе Pascal, GP107 отличается от Maxwell увеличенным объемом L1 (с 24 до 48 Кбайт).
Таким образом, в отношении шейдерной и текстурной пропускной способности на мегагерц частоты полнофункциональный GP107 сделал шаг вперед относительно GM107 и соответствует «порезанному» GM206 в составе GeForce GTX 950. В back-end процессора, представленном кешем L2, массивом ROP и четырьмя 32-битными контроллерами памяти, также есть очевидные изменения.
В силу того, что архитектура Pascal обладает прогрессивной компрессией цвета, а контроллеры позволяют работать с памятью на существенно большей частоте, чем в GM107 (7000 вместо 5400 Мбит/с на контакт), разработчикам понадобилось удвоить количество ROP по сравнению с GM107. Одновременно появилась возможность сэкономить транзисторный бюджет на кеш-памяти второго уровня (1 Мбайт против 2 Мбайт в GM107).
Блок-схема NVIDIA GP107
Тем не менее процессор получился весьма крупным для своей категории: число транзисторов в GP107 составляет 3,3 млрд. Разумеется, часть этого объема была израсходована на реализацию многочисленных новых функций, представленных в архитектуре Pascal, поэтому по числу транзисторов GP107 не только существенно «разбух» относительно GM107 (1,87 млрд), но и обходит GM206 (2,94 млрд). Вот краткий список нововведений архитектуры Pascal:
- улучшенная компрессия цвета с соотношениями вплоть до 8:1;
- функция Simultaneous Multi-Projection геометрического движка PolyMorph Engine, позволяющая за один проход создавать вплоть до 16 проекций геометрии сцены (для VR и систем с несколькими дисплеями в конфигурации NVIDIA Surround);
- возможность прерывания (preemption) в процессе исполнения draw call (при рендеринге) и потока команд (при вычислениях), которая вместе с динамическим распределением вычислительных ресурсов GPU обеспечивает полноценную поддержку асинхронных вычислений (Async Compute) — дополнительного источника быстродействия в играх под API DirectX 12 и сниженной латентности в VR;
- аппаратное декодирование и кодирование видео в форматах H.264, H.265 (HEVC) и VP9;
- контроллер дисплея, совместимый с интерфейсами DisplayPort 1.3/1.4 и HDMI 2.b. Поддержка высокого динамического диапазона (HDR);
- шина SLI с повышенной пропускной способностью (соответствующие блоки, вероятнее всего, исключены из GP107 в связи с отсутствием поддержки SLI).
На базе процессора GP107 NVIDIA выпустила две видеокарты, из которых GTX 1050 Ti комплектуется полнофункциональным ядром и 4 Гбайт RAM. В GTX 1050 отключен один из шести SM, а штатный объем видеопамяти составляет 2 Гбайт.
Первое, что бросается в глаза, когда смотришь в спецификации видеокарт, это консервативные тактовые частоты по сравнению с таковыми в моделях GTX 1060 и старше. До момента, когда NVIDIA распространила подробную документацию на GTX 1050/1050 Ti, это вызывало определенное смущение в прессе. Нетрудно придти к преждевременному выводу о том, что смена производственной линии на 14 нм FinFET по технологии Samsung заразила GPU NVIDIA той же болезнью, от которой пострадал Polaris. Однако разработчик утверждает, что ограничивающим фактором стал тепловой пакет, установленный на уровне 75 Вт, для того, чтобы партнеры NVIDIA могли выпустить видеокарты, не требующие дополнительного питания. В эмпирической части обзора мы еще увидим, каких частот в действительности может достигнуть GP107.
Также любопытно, что GTX 1050 обладает повышенными частотами GPU по сравнению с «титановой» версией. По данным NVIDIA, младшая из двух новинок обладает втрое большим быстродействием в играх, чем GeForce GTX 650, и чуть более чем на 50 % превосходит GeForce GTX 750 Ti.
Производитель | NVIDIA | |||||
Модель | GeForce GTX 750 Ti | GeForce GTX 950 | GeForce GTX 1050 | GeForce GTX 1050 Ti | GeForce GTX 1060 3GB | GeForce GTX 1060 |
Графический процессор | ||||||
Название | GM107 | GM206 | GP107 | GP107 | GP106 | GP106 |
Микроархитектура | Maxwell | Maxwell 2 | Pascal | Pascal | Pascal | Pascal |
Техпроцесс, нм | 28 нм | 28 нм | 14 нм FinFET | 14 нм FinFET | 16 нм FinFET | 16 нм FinFET |
Число транзисторов, млн | 1 870 | 2 940 | 3 300 | 3 300 | 4 400 | 4 400 |
Тактовая частота, МГц: Base Clock / Boost Clock | 1 020 / 1 085 | 1 024 / 1 188 | 1 354 / 1 455 | 1 290 / 1 392 | 1 506 / 1 708 | 1 506 / 1 708 |
Число шейдерных ALU | 640 | 768 | 640 | 768 | 1 152 | 1 280 |
Число блоков наложения текстур | 40 | 48 | 40 | 48 | 72 | 80 |
Число ROP | 16 | 32 | 32 | 32 | 48 | 48 |
Оперативная память | ||||||
Разрядность шины, бит | 128 | 128 | 128 | 128 | 192 | 192 |
Тип микросхем | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 1 350 (5 400) | 1 652,5 (6 610) | 1 750 (7 000) | 1 750 (7 000) | 2 000 (8 000) | 2 000 (8 000) |
Объем, Мбайт | 1 024 / 2 048 | 2 048 / 4 096 | 2 048 | 4 096 | 3 072 | 6 144 |
Шина ввода/вывода | PCI Express 3.0 x16 | |||||
Производительность | ||||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 1 389 | 1 823 | 1 862 | 2 138 | 3 935 | 4 373 |
Производительность FP32/FP64 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 |
Пропускная способность оперативной памяти, Гбайт/с | 86 | 106 | 112 | 112 | 192 | 192 |
Вывод изображения | ||||||
Интерфейсы вывода изображения | DL DVI-D, DisplayPort 1.2, HDMI 2.0 | DL DVI-D, DisplayPort 1.2, HDMI 2.0 | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b |
TDP, Вт | 60 | 90 | 75 | 75 | 120 | 120 |
Рекомендованная розничная цена на момент выхода (США, без налога, (Founders Edition/нереференсных видеокарт), $ | 149 | 109 | 109 | 139 | 199 | 249/299 |
Рекомендованная розничная цена на момент выхода, Россия, ( Founders Edition/нереференсных видеокарт ), руб. | 5 490 | 12 490 | 8 490 | 10 490 | — | 18 990 / — |
Официальные цены на GTX 1050 и GTX 1050 Ti установлены на уровне $109 и $139 соответственно (рынок США, без налога на продажи). Российские — 8 490 руб. и 10 490 руб. соответственно.
Однако рыночная ниша, на которую нацелены новинки, уже освоена конкурирующими продуктами конкурента. AMD парировала выход GeForce GTX 1050/1050 Ti снижением цен на модификации Radeon RX 460 с 2 и 4 Гбайт RAM — c $109/139 до $89/99. Новая российская цена объявлена для младшей версии видеокарты — 7 530 руб.
NVIDIA не подготовила референсной версии GeForce GTX 1050/1050 Ti, в отличие от GeForce GTX 750/750 Ti. Вместо этого производители с первого дня продаж начнут продавать видеокарты собственного дизайна. Для тестирования нам предоставили образцы MSI GeForce GTX 1050 2G OC и GeForce GTX 1050 Ti 4G OC — довольно простые реализации новых моделей, обладающие немного повышенными тактовыми частотами GPU: 1 404 / 1 518 МГц и 1341 / 1455 МГц для GTX 1050 и GTX 1050 Ti соответственно. В тестировании тактовые частоты видеокарт MSI были приведены к референсным значениям.
С виду две видеокарты MSI абсолютно одинаковы. На компактной плате установлена система охлаждения простейшей конструкции: монолитный фрезерованный радиатор и единственная крупная крыльчатка.
Более подробно описывать внешний вид устройства и конструкцию системы охлаждения в данном случае не имеет смысла — фотографии говорят за себя.
Единственное, что отличает GeForce GTX 1050 Ti от GTX 1050 в данной серии видеокарт, — это микросхемы RAM вдвое более высокой емкости. По остальным признакам устройства идентичны, включая четырехфазную систему питания: три фазы для GPU и одна — для чипов RAM.
Микросхемы памяти изготовлены Samsung и рассчитаны на эффективную частоту 7 ГГц.
Энергопотребление видеокарты составляет 49 Вт, а рекомендуемый блок питания на 300 Вт.
NVIDIA GeForce GT 730 (GF108) поддерживает Microsoft DirectX 12 (API) и OpenGL 4.5.
Характеристики видеокарты NVIDIA GeForce GT 730 (GF108)
Поддержка дисплеев: | |
---|---|
Максимальное цифровое разрешение: | 3840x2160@60Гц HDMI; 3840x2160@60Гц DisplayPort |
Максимальное VGA разрешение: | 2048x1536 |
Стандартные разъемы: | Dual Link DVI-D, HDMI, VGA |
Поддержка нескольких мониторов: | Да |
HDCP : | Да |
HDMI : | Да |
Аудио вход для HDMI: | Internal |
Тепловые характеристики: | |
---|---|
Максимальная температура GPU: | 98 ℃ |
Потребление энергии ( TDP ): | 49 Вт |
Рекомендованные требования по питанию: | 300 Вт |
Дополнительные разъемы питания: | Нет |
Размеры видеокарты: | |
---|---|
Высота: | 6,8 см |
Длина: | 14,4 см |
Ширина: | 2 слота |
Технологии и возможности: | |
---|---|
V-Sync : | Да |
PhysX : | Да |
DirectX : | 12 (API) |
OpenGL : | 4.5 |
Шина: | PCI Express 2.0 |
Поддержка ОС: | Microsoft Windows 7-10, Linux, FreeBSDx86 |
Обратите внимание: в таблице представлены эталонные характеристики видеокарты, они могут отличаться у разных производителей.
Характеристики
Общие параметры GP108: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GP108, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Количество потоковых процессоров | 384 | из 18432 (AD102) |
Количество транзисторов | 1,800 млн | из 14400 (GeForce GTX 1080 SLI (мобильная)) |
Технологический процесс | 14 нм | из 4 (H100 PCIe) |
Другие видеокарты
Здесь мы рекомендуем несколько видеокарт, более или менее близких по производительности к рассмотренной.
Устаревшие драйверы драйверы для видеокарты NVIDIA GeForce GT 730 (GF108)
Внимание! Начиная с апреля 2018 года компания NVIDIA остановила поддержку видеокарт на микроархитектуре Fermi.
Полный список видеокарт NVIDIA GeForce на основе архитектуры Fermi.
Энергопотребление видеокарты составляет 30 Вт, а рекомендуемый блок питания на 300 Вт.
NVIDIA GeForce GT 1030 поддерживает Microsoft DirectX 12 API и OpenGL 4.5.
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GP108, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | не участвует | |
Архитектура | Pascal (2016−2021) | |
Графический процессор | GP108 | |
Тип | Десктопная | |
Дата выхода | нет данных | |
Цена сейчас | 27$ | из 49999 (A100 SXM4) |
Характеристики видеокарты NVIDIA GeForce GT 1030
Характеристики памяти: | |
---|---|
Объем памяти: | 2 Gb |
Тип памяти: | GDDR5 |
Шина памяти: | 64-bit |
Быстродействие памяти: | 3000 Мбит/с (3 Гбит/с) |
Пропускная способность: | 48 Gbps |
Поддержка дисплеев: | |
---|---|
Максимальное цифровое разрешение: | 7680x4320@60 Hz |
Поддержка нескольких мониторов: | Да |
HDCP : | 2.2 |
Тепловые характеристики: | |
---|---|
Максимальная температура GPU: | 97 ℃ |
Потребление энергии ( TDP ): | 30 Вт |
Рекомендованные требования по питанию: | 300 Вт |
Дополнительные разъемы питания: | Нет |
Размеры видеокарты: | |
---|---|
Высота: | 12 см |
Длина: | 15,24 см |
Ширина: | 2 слота |
Технологии и возможности: | |
---|---|
Multi-Projection: | Нет |
Поддержка VR : | Нет |
Ansel : | Нет |
SLI : | Нет |
G-Sync : | Нет |
PhysX : | Да |
GameStream : | Нет |
GPU Boost : | Да |
DirectX : | 12 API |
Vulkan API: | Да |
OpenGL : | 4.5 |
Шина: | PCIe 3.0 |
Поддержка ОС: | Microsoft Windows 7-10, Linux, FreeBSDx86 |
Обратите внимание: в таблице представлены эталонные характеристики видеокарты, они могут отличаться у разных производителей.
По-видимому, NVIDIA ещё не полностью распрощалась с архитектурой Pascal. Несколько дней назад компания без лишнего шума запустила графический ускоритель GeForce GT 1010. Сейчас поиск по названию карты даёт мало стоящих результатов. Однако GT 1010 указана на официальной странице загрузки драйверов NVIDIA. Что же это за карта и когда её можно будет купить?
NVIDIA GeForce GT 1030
Ресурс TechPowerUp опубликовал характеристики NVIDIA GeForce GT 1010. Согласно сайту, GT 1010 основана на 14-нм графическом процессоре GP108. Площадь этого кристалла составляет 74 мм 2 и он включает 1,8 млрд транзисторов. По сути, GT 1010 — это тот же ускоритель, что и GT 1030, с некоторыми отключёнными ядрами CUDA. Если GT 1030 предлагает 384 ядра CUDA, то GT 1010 — лишь 256 (то есть два работающих потоковых мультипроцессора).
GT 1010 оснащается 2 Гбайт видеопамяти GDDR5, работающими через 64-бит интерфейс. Базовая частота графического процессора составляет 1228 МГц и может увеличиваться до 1468 МГц в режиме Turbo. Кроме того, карта имеет 16 блоков текстурирования (TMU), 16 блоков растровых операций (ROP) и отличается показателем TDP всего 55 Вт, то есть может работать от слота PCIe без подключения внешних разъёмов питания.
Пока неясно, будет ли GT 1010 доступна только производителям OEM (что вероятнее всего) или же поступит в розницу. Хотя такой урезанный ускоритель на базе устаревшей архитектуры Pascal может показаться странным в 2021 году, NVIDIA думает иначе и видит для него потенциальный рынок. Возможно, мы ещё увидим и GeForce GT 1020, которая сделает номенклатуру серии завершённой?
Это десктопная видеокарта на архитектуре Pascal и техпроцессе 14 нм, в первую очередь рассчитанная на геймеров.
У нас нет данных о результатах тестирования GP108.
Технологии
Здесь перечислены поддерживаемые GP108 технологические решения и API. Такая информация понадобится, если от видеокарты требуется поддержка конкретных технологий.
PureVideo HD | VP8 |
Поддержка API
Перечислены поддерживаемые GP108 API, включая их версии.
DirectX | 12 (12_1) |
Шейдерная модель | 6.4 |
OpenGL | 4.6 |
OpenCL | 3.0 |
Vulkan | 1.3 |
CUDA | 6.1 |
Читайте также: