Nvidia geforce 7800 сколько памяти
NVIDIA начала продажи GeForce 7800 GTX 512 14 ноября 2005 по рекомендованной цене 649$. Это десктопная видеокарта на архитектуре Curie и техпроцессе 110 нм, в первую очередь рассчитанная на геймеров. На ней установлено 512 Мб памяти GDDR3 на частоте 1.7 ГГц, и вкупе с 256-битным интерфейсом это создает пропускную способность 54.40 Гб/с.
С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 1.0 x16. Длина референсной версии – 228 мм. Для подключения не требуется дополнительный кабель питания, а потребляемая мощность – 108 Вт.
У нас нет данных о результатах тестирования GeForce 7800 GTX 512.
Рекомендуемые процессоры
По нашей статистике эти процессоры чаще всего используются с GeForce 7800 GTX 512.
NVIDIA начала продажи GeForce 7800 GT 11 августа 2005 по рекомендованной цене 449$. Это десктопная видеокарта на архитектуре Curie и техпроцессе 110 нм, в первую очередь рассчитанная на офисное использование. На ней установлено 256 Мб памяти GDDR3 на частоте 1 ГГц, и вкупе с 256-битным интерфейсом это создает пропускную способность 32.00 Гб/с.
С точки зрения совместимости это однослотовая карта, подключаемая по интерфейсу PCIe 1.0 x16. Длина референсной версии – 226 мм. Для подключения требуется дополнительный 1x 6-pin кабель питания, а потребляемая мощность – 65 Вт.
Она обеспечивает слабую производительность в тестах и играх на уровне
от лидера, которым является NVIDIA GeForce RTX 3090 Ti.
Совместимость и размеры
Параметры, отвечающие за совместимость GeForce 7800 GTX с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Интерфейс | PCIe 1.0 x16 |
Длина | 228 мм |
Толщина | 1 слот |
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce 7800 GTX 512, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | не участвует | |
Архитектура | Curie (2003−2013) | |
Графический процессор | G70 | |
Тип | Десктопная | |
Дата выхода | 14 ноября 2005 (16 лет назад) | |
Цена на момент выхода | 649$ | |
Цена сейчас | 250$ (0.4x) | из 49999 (A100 SXM4) |
Поддержка API
Перечислены поддерживаемые GeForce 7800 GT API, включая их версии.
DirectX | 9.0c (9_3) | |
Шейдерная модель | 3.0 | |
OpenGL | 2.1 | из 4.6 (GeForce GTX 1080 (мобильная)) |
OpenCL | N/A | |
Vulkan | N/A |
Общая производительность в тестах
Это наш суммарный рейтинг производительности. Мы регулярно улучшаем наши алгоритмы, но если вы обнаружите какие-то несоответствия, не стесняйтесь высказываться в разделе комментариев, мы обычно быстро устраняем проблемы.
Это очень распространенный бенчмарк, входящий в состав пакета Passmark PerformanceTest. Он дает видеокарте тщательную оценку, производя четыре отдельных теста для Direct3D версий 9, 10, 11 и 12 (последний по возможности делается в разрешении 4K), и еще несколько тестов, использующих DirectCompute.
NVIDIA начала продажи GeForce 7800 GTX 22 июня 2005 по рекомендованной цене 599$. Это десктопная видеокарта на архитектуре Curie и техпроцессе 110 нм, в первую очередь рассчитанная на офисное использование. На ней установлено 256 Мб памяти GDDR3 на частоте 1.2 ГГц, и вкупе с 256-битным интерфейсом это создает пропускную способность 38.40 Гб/с.
С точки зрения совместимости это однослотовая карта, подключаемая по интерфейсу PCIe 1.0 x16. Длина референсной версии – 228 мм. Для подключения не требуется дополнительный кабель питания, а потребляемая мощность – 86 Вт.
Она обеспечивает слабую производительность в тестах и играх на уровне
от лидера, которым является NVIDIA GeForce RTX 3090 Ti.
Splinter Cell Chaos Theory
Это новый тест, введен впервые в наши инструментарии, игра также очень сильно нагружает ускорители, используются шейдеры версии 3.0. К сожалению, версия игры 1,04 хоть и включает шейдеры 2.0 для карт от ATI, эта модель работает только на них. То есть картам от NVIDIA доступны лишь 1.1 и 3.0 модели шейдеров. Поэтому пришлось сравнивать продукты, работающие на разных моделях, но при выключенном HDR (который также не совместим с АА).
Ситуация схожа с предыдущей, в высоких разрешениях очевидно, что 7800 GT уже упирается в ПСП. Но в целом картина более отрадная для новинки, чем выше: даже X850XT PE практически остался позади (кроме 1600х1200 при АА+АФ).
Игровые тесты, сильно нагружающие как блоки вершинных шейдеров, так и блоки пиксельных шейдеров 2.0
F.E.A.R. (MP beta)
Разница между эмуляцией и реальным 7800GT достигла 10%. С чем это связано? — Трудно сказать. Думаю, что с драйверами. Может быть, и там отработала игра, которая «щупает» карты и подстраивается под них (вполне возможно, что демо-версия уже «знает» про 7800 GTX, и не в курсе насчет 7800 GT). Впрочем, разница все равно не столь большая. А вот то, что ПСП в данном тесте уже сыграла злую шутку с 7800 GT, — это очевидно. Посмотрите, как браво 7800 GT выступает в младших разрешениях! И как резко сдал позиции в 1600х1200… Впрочем, уровень играбельности в F.E.A.R. при максимальном качестве таков, что играть можно только в 1024х768, и то только на мощнейших акселераторах. Поэтому проигрыш в 1600х1200 является чисто номинальным.
Другие видеокарты
Здесь мы рекомендуем несколько видеокарт, более или менее близких по производительности к рассмотренной.
Поддержка API
Перечислены поддерживаемые GeForce 7800 GTX API, включая их версии.
DirectX | 9.0c (9_3) | |
Шейдерная модель | 3.0 | |
OpenGL | 2.1 | из 4.6 (GeForce GTX 1080 (мобильная)) |
OpenCL | N/A | |
Vulkan | N/A |
Оперативная память
Параметры установленной на GeForce 7800 GTX памяти - тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая - часть оперативной памяти.
Тип памяти | GDDR3 | |
Максимальный объём памяти | 256 Мб | из 128 (Radeon Instinct MI250X) |
Ширина шины памяти | 256 бит | из 8192 (Radeon Instinct MI250X) |
Частота памяти | 1200 МГц | из 19500 (GeForce RTX 3090) |
Пропускная способность памяти | 38.40 Гб/с | из 14400 (Radeon R7 M260) |
Общая производительность в тестах
Это наш суммарный рейтинг производительности. Мы регулярно улучшаем наши алгоритмы, но если вы обнаружите какие-то несоответствия, не стесняйтесь высказываться в разделе комментариев, мы обычно быстро устраняем проблемы.
Это очень распространенный бенчмарк, входящий в состав пакета Passmark PerformanceTest. Он дает видеокарте тщательную оценку, производя четыре отдельных теста для Direct3D версий 9, 10, 11 и 12 (последний по возможности делается в разрешении 4K), и еще несколько тестов, использующих DirectCompute.
Мозговзрывающая производительность.
(дословный перевод строчки
из информации для прессы).
Итак, заканчивается затяжной период ожидания новых ускорителей. Вот она, новая верхняя модель от NVIDIA и, если все пойдет хорошо, то осенью мы сможем стать свидетелями ее конкуренции с новым топовым решением от ATI, которое (что уже не секрет) также будет способно исполнять шейдеры 3.0. Увидим кто кого! Пока же начнем наше всестороннее изучение GeForce 7800 GTX. Разумеется, как это уже стало традиционным, начнем мы его спецификациями, диаграммами и теоретической частью.
Оперативная память
Параметры установленной на GeForce 7800 GTX 512 памяти - тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая - часть оперативной памяти.
Тип памяти | GDDR3 | |
Максимальный объём памяти | 512 Мб | из 128 (Radeon Instinct MI250X) |
Ширина шины памяти | 256 бит | из 8192 (Radeon Instinct MI250X) |
Частота памяти | 1700 МГц | из 19500 (GeForce RTX 3090) |
Пропускная способность памяти | 54.40 Гб/с | из 14400 (Radeon R7 M260) |
Совместимость и размеры
Параметры, отвечающие за совместимость GeForce 7800 GT с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Интерфейс | PCIe 1.0 x16 |
Длина | 226 мм |
Толщина | 1 слот |
Дополнительные разъемы питания | 1x 6-pin |
Характеристики
Общие параметры GeForce 7800 GTX 512: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce 7800 GTX 512, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Частота ядра | 550 МГц | из 2610 (Radeon RX 6500 XT) |
Количество транзисторов | 302 млн | из 14400 (GeForce GTX 1080 SLI (мобильная)) |
Технологический процесс | 110 нм | из 4 (H100 PCIe) |
Энергопотребление (TDP) | 108 Вт | из 900 (Tesla S2050) |
Скорость текстурирования | 13.20 | из 939.8 (H100 SXM5) |
Поддержка API
Перечислены поддерживаемые GeForce 7800 GTX 512 API, включая их версии.
DirectX | 9.0c (9_3) | |
Шейдерная модель | 3.0 | |
OpenGL | 2.1 | из 4.6 (GeForce GTX 1080 (мобильная)) |
OpenCL | N/A | |
Vulkan | N/A |
Результаты тестов: сравнение производительности
-
Tomb Raider: Angel of Darkness v.49 (Core Design/Eldos Software) DirectX 9.0, Paris5_4 demo. Тестирование проводилось при максимально установленном качестве, выключены были лишь Depth of Fields PS20.
Выражаю благодарность Ринату Досаеву (AKA 4uckall) и Алексею Островскому (AKA Дучче) за написание демо к данной игре, а также большое спасибо Алексею Берилло AKA Somebody Else за помощь
В прошлом материале по GeForce 7800 GTX от Leadtek я уже демонстрировал эмуляцию 7800GT (ведь легко при помощи RivaTuner-а уменьшить число конвейеров и снизить частоты), поэтому очень интересно будет сравнить эти результаты с теми показателями, что мы получили от настоящего 7800 GT.
Далее: напомню еще раз, что исходя из цен, прямой конкурент 7800GT — X850 XT (не PE!). Хотя ради интереса мы привели данные и по X850 XT PE тоже. Разумеется, сравним и с предыдущим королем Hi-End от NVIDIA — GeForce 6800 Ultra, который должен уйти на более низкую ценовую ступень, и вообще этот продукт будет снят с производства по мере удешевления 7800GT.
Игровые тесты, сильно нагружающие блоки пиксельных шейдеров 2.0.
Спецификации GeForce 7800 GTX (кодовое название G70)
Новое кодовое название чипа. Что хотела сказать этим NVIDIA? Забегая вперед, отметим, что, несмотря на заметный рост производительности, эту архитектуру не следует считать принципиально новой — на лицо развитие и совершенствование хорошо знакомой нам по семейству NV4X архитектуры. Следовательно, новое кодовое название чипа введено по иной причине. Может, потому что NV47 звучало бы слишком рядовым образом, а архитектурные отличия от NV45 все-таки заметны, и сильнее, чем в случае привычного тюнинга, а может и по другим причинам, о которых мы можем только догадываться.
Перед прочтением рекомендуем внимательно ознакомиться с базовыми материалами DX Current, DX Next и Longhorn описывающими различные аспекты современных аппаратных ускорителей графики вообще, и архитектурные особенности продукции NVIDIA и ATI в частности. Информацию о предыдущей флагманской архитектуре NVIDIA также можно почерпнуть из соответствующей статьи:
NVIDIA GeForce 6800 Ultra (NV40).
А теперь, спецификации новинки:
Официальные спецификации GeForce 7800
- Кодовое имя чипа G70 (ранее известен как NV47)
- Технология 110 нм (предполагаемый производитель TSMC)
- 302 миллиона транзисторов (рекорд на данный момент)
- FС корпус (flip-chip, перевернутый чип без металлической крышки)
- 256 бит интерфейс памяти
- До 1 гигабайта GDDR-3 памяти
- PCI Express 16х шинный интерфейс
- 24 Пиксельных процессора, по одному текстурному блоку на каждом, с произвольной фильтрацией целочисленных и плавающих FP16 текстур (в том числе анизотропия, степени до 16х включительно) и бесплатной нормализацией FP16 векторов. Пиксельные процессоры улучшены по сравнению с NV4X — увеличено число ALU, возможно эффективное выполнения MAD операции.
- 8 Вершинных процессоров, по одному текстурному блоку на каждом, без фильтрации выбираемых значений (дискретная выборка).
- Вычисление, блендинг и запись до 16 полных (цвет, глубина, буфер шаблонов) пикселей за такт
- Вычисление и запись до 32 значений глубины и буфера шаблонов за такт (если не производятся операции с цветом)
- Поддержка «двустороннего» буфера шаблонов
- Поддержка специальных оптимизаций прорисовки геометрии для ускорения алгоритмов теней на основе буфера шаблонов и аппаратные карты теней (т.н. технология Ultra Shadow II)
- Все необходимое для поддержки пиксельных и вершинных шейдеров версии 3.0, включая динамические ветвления в пиксельных и вершинных процессорах, выбор значений текстур из вершинных процессоров и т.д.
- Фильтрация текстур в плавающем формате FP16.
- В вершинных шейдерах аппаратная фильтрация текстур не поддерживается, доступна только выборка значений без фильтрации.
- Поддерживается буфер кадра в плавающем формате (включая операции блендинга в формате компонент FP16 и только запись в формате FP32)
- MRT (Multiple Render Targets — рендеринг в несколько буферов)
- 2x RAMDAC 400 МГц
- 2x DVI интерфейса (требуются внешние интерфейсные чипы)
- TV-Out и HDTV-Out интерфейсы встроены в чип ускорителя
- TV-In интерфейс (требуется отдельный интерфейсный чип для видеозахвата)
- Программируемый аппаратный потоковый видеопроцессор (для задач компрессии, декомпрессии и постобработки видео), новое поколение, с производительностью достаточной для качественного деинтерлейсинга HDTV
- 2D ускоритель с поддержкой всех функций GDI+
- Поддержка важных специальных возможностей графической драйверной модели Longhorn (степень поддержки пока неизвестна)
- Поддержка технологии SLI
Спецификации референсной карты GeForce 7800 GTX
- Частота ядра 430 МГц
- Эффективная частота памяти 1,2 ГГц (2*600 МГц)
- Тип памяти GDDR-3, 1,6 нс
- Объем памяти 256 мегабайт (будут варианты карты с 512 мегабайт, так как на предоставленной нам плате уже предусмотрены места для 512 мегабайт памяти)
- Пропускная способность памяти 38,4 гигабайта в сек.
- Теоретическая максимальная скорость закраски 6.9 гигапикселя в сек.
- Теоретическая скорость выборки текстур 10.4 гигатекселя в сек.
- Два DVI-I разъема
- SLI разъем
- Шина PCI-Express 16х
- TV-Out, HDTV-Out, поддержка HDCP
- Потребляет до 110 Ватт энергии (типовое потребление не превышает 100 Ватт, на карте один стандартный для PCI Express разъема дополнительного питания, рекомендуются источники питания суммарной мощностью 350 Ватт, для SLI режима — 500 Ватт).
- Более тонкая технология производства чипа, большее число транзисторов, меньшее энергопотребление карты (несмотря на большее число конвейеров и большую частоту!).
- Пиксельных процессоров не 16, а 24 (точнее, 6 процессоров квадов, вместо 4)
- Пиксельные процессоры стали производительнее — увеличено число ALU, ускорена работа со скалярными величинами и скалярным произведением/MAD.
- Вершинных процессоров стало 8 вместо 6, судя по всему, они не изменились
- Появилась производительная аппаратная поддержка для воспроизведения видео в формате HDTV и HDTV выход, совмещенный с TV-выходом.
Тесты в бенчмарках
Это результаты тестов GeForce 7800 GTX на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.
FarCry, Regulator
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce 7800 GTX 512, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | не участвует | |
Архитектура | Curie (2003−2013) | |
Графический процессор | G70 | |
Тип | Десктопная | |
Дата выхода | 14 ноября 2005 (16 лет назад) | |
Цена на момент выхода | 649$ | |
Цена сейчас | 250$ (0.4x) | из 49999 (A100 SXM4) |
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce 7800 GT, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности | 1021 | |
Соотношение цена-качество | 0.01 | |
Архитектура | Curie (2003−2013) | |
Графический процессор | G70 | |
Тип | Десктопная | |
Дата выхода | 11 августа 2005 (16 лет назад) | |
Цена на момент выхода | 449$ | |
Цена сейчас | 250$ (0.6x) | из 49999 (A100 SXM4) |
Для получения индекса мы сравниваем характеристики видеокарт и их стоимость, учитывая стоимость других карт.
Тесты в бенчмарках
Это результаты тестов GeForce 7800 GT на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.
Видеовыходы
Перечисляются имеющиеся на GeForce 7800 GT видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Видеоразъемы | 2x DVI, 1x S-Video |
FarCry, Research
Оперативная память
Параметры установленной на GeForce 7800 GT памяти - тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая - часть оперативной памяти.
Тип памяти | GDDR3 | |
Максимальный объём памяти | 256 Мб | из 128 (Radeon Instinct MI250X) |
Ширина шины памяти | 256 бит | из 8192 (Radeon Instinct MI250X) |
Частота памяти | 1000 МГц | из 19500 (GeForce RTX 3090) |
Пропускная способность памяти | 32.00 Гб/с | из 14400 (Radeon R7 M260) |
Установка и драйверы
- Компьютер на базе Athlon 64 (939Socket)
- процессор AMD Athlon 4000+ (2400MHz) (L2=1024K);
- системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI;
- оперативная память 1 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
- жесткий диск WD Caviar SE WD1600JD 160GB SATA.
В процессе работы провели мониторинг температуры, как и ожидалось, особых всплесков нет. Предельные значения в рамках до 80 градусов по нагреву ядра.
Разгон. Как известно, блоки ROP/Shader могут работать только на частотах 432,459,486,513 МГц (потенциально и выше, но вряд ли такие чипы найдутся). Только лишь блок геометрии позволяет плавно регулировать его частоту работы. Видеокарта не потянула частоту ядра в 486/486/530 МГц именно из-за первых двух блоков, поэтому стабильность при разгоне получена была только при частотах 459/459/510 МГц. По памяти предел — 1120 МГц. Таким образом, можно констатировать, что действительно на 7800GT идут отбраковки от GTX, чипы даже с 20-ю конвейерами способные на решающих блоках едва держать 460 МГц.
Итак, перед нами GeForce 7800 GT. Как видите, его легко распознала утилита RivaTuner (автор А.Николайчук AKA Unwinder), и показала правильно и число конвейеров, и частоты. Да и мониторинг работает (как выше было видно).
Разумеется, я попробовал разблокировать 1 квад и 1 вершинный конвейер, однако, как я уже выше отмечал, попытка неудачная. Хоть регистр и перепрограммируется, данное число конвейеров зашито намертво в самом ядре. NVIDIA избавилась от «граблей», на которые наступала со времен NV4x. Еще во времена более поздних NV40 появилась информация о том, что разблокировки у 6800/6800LE уже стали невозможными (есть вероятность, что на эти карты ставят уже NV48 — производства TSMC по 0.11 мкм, где аппаратно прошивают числа конвейеров еще на стадии тестирования кристалла или даже раньше). Да и NV41/NV42, что идут на 6800LE (8 конвейеров) не разблокируются более (12 конвейеров). Так что, для оверклокеров и желавших купить дешевле и легко получить бесплатно мощь более дорогих карт — настают неприятные времена.
Архитектура ускорителя
Теперь, по традиции, перейдем к общей диаграмме чипа:
Основные отличия этой диаграммы от NV45 — наличие 8 вершинных процессоров и 6 процессоров квадов (всего, таким образом, обрабатывается 4*6=24 пикселя) вместо 4 с большим числом ALU для каждого процессора. Обратите внимание на вынесенный на схеме за пределы процессора квадов блок AA, блендинга и записи результатов. Дело в том, что, несмотря на увеличенное в полтора раза число пиксельных процессоров, число модулей отвечающих за запись результатов осталось прежним — их 16. То есть новый чип может существенно быстрее рассчитывать шейдеры, причем у 24 пикселей параллельно, но по-прежнему записывает не более 16 полноценных пикселей за такт. Что, впрочем, вполне достаточно — большее число пикселей за такт не пропустит память, да и современные приложения тратят несколько десятков команд, прежде чем вычислить и записать одно результирующее значение пикселя, поэтому рост числа пиксельных процессоров без роста числа модулей записи видится вполне сбалансированным и логичным решением. Такие решения применялись и ранее в бюджетных чипах NVIDIA (GeForce 6200, например), которые имели полноценный процессор квадов, но обрезанные модули записи (по числу блоков и по отсутствию FP16 блендинга).
Пиксельный конвейер
Итак, в наличии следующая архитектура пиксельной части:
Посмотрим на желтый блок пиксельного процессора (процессора квадов). Можно сказать, что было произведено «турбирование» существовавшей ранее в NV40/45 схемы — к двум полным векторным ALU способным исполнять 2 разные операции над 4 компонентами были добавлены два скалярных mini ALU для параллельного исполнения простых операций. Теперь ALU умеют выполнить MAD операцию (одновременное умножение и сложение) без какого либо пенальти. Утверждается, что такая «расточка цилиндров» может привести к 2-х кратному росту производительности некоторых особенно тяжелых и удобных шейдеров (которым удается полностью загрузить и обычные ALU и mini-ALU) и к 1.5 кратному росту шейдерной мощи в среднем. Действительно, MAD очень популярная операция и встречаются в типовых пиксельных шейдерах по многу раз. К такой конфигурации ALU специалисты NVIDIA пришли после статистического исследования множества различных реальных игровых шейдеров, но, названная цифра (1.5 раза) выглядит слишком оптимистичной, что свойственно PR отделу NVIDIA, и далее мы проверим на практике, какое влияние этот архитектурный момент окажет на наши синтетические и игровые тесты.
Добавление небольших упрощенных и специализированных ALU — старый прием NVIDIA, уже не один раз позволявший компании малым числом транзисторов заметно увеличить производительность пиксельных блоков. Например, еще NV4X имели специальный блок для нормализации FP16[4] векторов (на схеме он пристыкован ко второму основному ALU и назван FP16 NORM), и в G70 эта традиция была продолжена - такой блок позволяет существенно увеличить производительность пиксельных шейдеров благодаря возможности бесплатной нормализации векторов на каждом проходе квада через конвейер процессора. Интересно, что операция нормализации кодируется в шейдерах в виде последовательности нескольких команд, и драйвер должен распознавать это действие, и подменять на одно обращение к этому специальному блоку. Однако на практике это распознавание происходит достаточно эффективно, особенно если шейдер был скомпилирован из HLSL, и таким образом пиксельные процессоры NVIDIA не тратят на нормализацию векторов несколько тактов как в случае ATI (важно не забывать об ограничении на формат - FP16, то есть половинная точность).
Что касается текстурных модулей — то тут все осталось прежним — по одному модулю на пиксель (то есть четыре модуля в процессоре квадов), собственный кэш первого уровня у каждого процессора квадов, фильтрация текстур с целочисленным или FP16 форматом компонент, до 4-х компонент включительно (FP16[4]). Выборка значений из текстур с форматом компонент FP32 возможна, но без аппаратной фильтрации — оную придется или не делать, или запрограммировать в пиксельном шейдере, потратив на это десяток и более инструкций. Впрочем, так было и раньше — полноценная поддержка FP32 компонент будет, видимо, только в следующем поколении архитектур.
- Запись цвета — FP32[4], FP16[4], INT8[4] за такт, в том числе в разные буфера (MRT).
- Сравнение и блендинг цвета — FP16[4], INT8[4], для формата компонент FP32 не поддерживается
- Сравнение, генерация и запись глубины (Z) — все режимы, при отсутствии цвета — два значения за такт (режим Z-only). В режиме MSAA — также, два значения за такт.
- MSAA — INT8[4], для плавающих форматов компонент не поддерживается.
Столько условий возникает в результате достаточно большого количества аппаратных ALU необходимых для операций MSAA, генерации значений глубины, сравнения и блендинга цвета. NVIDIA пытается оптимизировать расход транзисторов и использует одни и те же ALU в разных целях в зависимости от задачи, вот почему плавающий формат делает невозможным MSAA, а формат FP32 и блендинг. Большой расход транзисторов является и одной из причин к тому, чтобы оставить 16 модулей, а не сделать их 24 в соответствии с числом пиксельных процессоров. Ведь в таком варианте большинство транзисторов этих блоков может (и будет) простаивать в современных приложениях с длинными шейдерами, даже в режиме 4хAA, а память, пропускная полоса которой практически не увеличилась по сравнению с GeForce 6800 Ultra, все равно не даст записать даже 16 полноценных пикселей за такт в буфер кадра. Так как эти модули работают асинхронно с пиксельными процессорами (рассчитывают значения глубины и делают блендинг, в то время как уже идет расчет цвета следующих пикселей в шейдере), наличие 16 блоков можно считать не просто обоснованным, а очевидным решением. А вот некоторые ограничения, связанные с FP форматами, досадны, но характерны для нашего переходного периода, на пути к симметричным архитектурам, которые будут позволять производить все операции со всеми доступными форматами данных без какой-либо потери скорости, как это в большинстве случаев позволяют гибкие современные CPU.
Вершинный конвейер
Здесь никаких особенных изменений:
Все хорошо знакомо нам по семейству NV4x, и только число вершинных процессоров увеличилось с 6 до 8. По-прежнему выборка текстур в вершинных процессорах происходит достаточно номинально — как по скорости, так и по возможностям. Фильтрация недоступна ни для каких форматов — только точечная выборка, да и ее скорость (как показывают тесты) не велика, по сравнению с пиксельными процессорами. Впрочем, пока эта возможность SM 3.0 мало востребована в реальных приложениях и с таким статусом «золушки» можно смириться. Но в глубине души хочется поскорее увидеть воплощение светлого WGF 2.0 будущего, хотя бы в таких частностях, как симметричные возможности по работе с текстурами в вершинных и пиксельных процессорах. Забегая вперед, отметим, что некоторые аспекты работы с геометрией (кэширование вершин) все-таки были усовершенствованны, и во второй части статьи мы исследуем этот вопрос.
Форматы данных, с которыми работает ускоритель
- VS 3.0 — FP32
- PS 3.0 — FP16, FP32
- Текстуры — INT8, FP16, FP32
- Буфер кадра — INT8, FP16, FP32
- VS 3.0 — FP32
- PS 3.0 — FP32
- Текстуры — INT8, FP16, FP32 (без фильтрации)
- Буфер кадра — INT8, FP16 (без MSAA), FP32 (без блендинга и MSAA)
Новая вкусная возможность для АА
А теперь поговорим о новых возможностях ускорителя, не нашедших места на вышеприведенных диаграммах но достаточно важных для нас. Впервые в наличии гамма-корректный MSAA (присутствовавший у чипов ATI со времен R3XX) и Transparent Supersampling — новшество в AA, впервые реализованное в этом чипе.
Как известно основная проблема MSAA состоит в том, что он сглаживает только края полигонов. Если полигон прозрачный или полупрозрачный (например, стекло, или решетка проволочного забора в игре, сделанная из текстуры, в которой прозрачные пиксели чередуются с непрозрачными), то сглаживания границ с тем, что проступает через этот полигон не происходит, и мы видим четкие ступеньки. Зато нам не приходится рассчитывать значения цвета для каждого отсчета (сэмпла), и мы обходимся только раздельными значениями глубины, а цвет один общий на все сэмплы. Основную проблему — ступеньки на краях полигонов такой метод устраняет эффективно. Но с прозрачными полигонами он не справляется. Второй метод — SSAA (суперсамплинг) честно рассчитывает все значения цвета для всех отсчетов, и мы получаем правильную картину даже через полупрозрачные полигоны с четкими границами прозрачных и непрозрачных областей. Однако тогда мы заметно проигрываем в скорости — нам надо выполнить пиксельные шейдеры в несколько раз больше — столько, сколько у нас отсчетов, 2 или 4 раза. Как быть? Предложен следующий выход:
На прозрачных полигонах автоматически включается полноценный SSAA (или, по выбору, специальная эмуляция - MSAA учитывающий прозрачность), на остальных производится обычный MSAA.
Решение простое и достаточно эффективное. Изменения в железе не очень большие — мы все равно храним глубину и цвет для отсчетов, как в том, так и в другом методе, и все что необходимо — автоматически переключать режим генерации AA отсчетов в зависимости от наличия или отсутствия прозрачности в настройках блендинга текущих треугольников. (вряд ли выбор происходит на уровне более точном, чем целый треугольник, и очевидно что он должен происходить автоматически). Далее мы исследуем его влияние на скорость и качество на практике, и более наглядно и подробно поговорим об этом нововведении.
Перейдем к первым практическим аспектам — описанию карты и исследованию ее с помощью синтетических тестов.
Лето перевалило через свой зенит и неумолимо движется к финалу. На горизонте уже сентябрь. Если днем еще даже жарко, то ночи все холоднее и холоднее. Это явный признак приближающейся осени… и резкого подъема спроса на всевозможные компьютерные приобретения, к коим относятся и 3D-ускорители.
Увы, но канадская ATI по-прежнему не подает признаков жизни из-за океана (лишь решив сделать очередной подарок в виде новой-старой карты RADEON X800GT, но о ней в следующий раз). Новых продуктов из Торонто пока нет. Зато калифорнийская NVIDIA, раскочегарившись еще в начале года, когда преодолела ужасную депрессию с дефицитом GeForce 6800 старших моделей; выставив новый High-End GeForce 7800 GTX, спешит предъявить и его более скромного собрата — GeForce 7800 GT.
О том, что следом за новым самым мощным на сегодня ускорителем выйдет чуть менее производительный, но все равно акселератор High-End уровня, было известно практически еще в июне. Но зачем потребовалось 1.5 месяца между выходами аналогичных членов новой Hi-End семейки? GeForce 6800 GT вышел через месяц после GeForce 6800 Ultra, и у 6xxx семейства GT и Ultra отличаются только частотами. Учитывая, что тогда чипов было очень мало, и можно было набрать нужное число чипов, которые не тянут частоты «ультры» и выпускать на них GT только по истечении какого-то времени.
А в случае с 7xxx — ситуация другая: 7800 GT от GTX отличается не только пониженными частотами, но и урезанным числом конвейеров рендеринга. А, следовательно, для накопления отбраковок потребуется больше времени даже с учетом того, что массовое производство G70 началось еще весной. К тому же кристалл получился у NVIDIA очень удачным, с хорошим процентом выхода годных, следовательно, или ждать долго, пока накопится некоторое количество чипов, не способных работать как GTX, но потенциально могущих потянуть нагрузку GT, или «резать» по конвейерам нормальные кристаллы. Полагаю, что второе болезненнее первого.
Плюс маркетинговые интересы: они диктуют — когда лучше сделать анонс нового продукта.
И вот, 11 августа вышел в свет GeForce 7800 GT. Суффикс GT говорит о том, что это середнячок в семействе 7800. По логике вещей, может появиться еще и GeForce 7800. Впрочем, как и 7800 Ultra, вместо которого пока 7800 GTX.
Отмечу еще раз, что у GeForce 7800 GTX 24 пиксельных и 8 вершинных конвейера, чип работает на частоте (Shader Unit/ROP unit/Vertex unit) 430/430/470 MHz, а карты на его основе оснащаются GDDR3 памятью, которая функционирует на частоте 600 (1200) МГц.
У GeForce 7800 GT характеристики следующие: 20 пиксельных и 7 вершинных конвейеров, частоты ядра: 400/400/440 МГц, карты будут оснащаться памятью, частота которой 500 (1000) МГц. Рекомендуемая розничная цена — 449 долларов США, что находится примерно на уровне RADEON X850 XT, который и будет главным оппонентом новинки. Есть информация, что цена на GeForce 6800 Ultra упадет до 399 долларов США, на 6800 GT — до 299 долларов, на 6800 — до 199. Как следствие, 6600GT будет уже стоить 149, а 6600 — 99, 6600LE — 79. Полагаю, что это сильно ударит по интересам канадской ATI, если та не предусмотрит ответные снижения цен. Хотя и в данном случае сверхприбылей уже не получить (не секрет, что 6% продаж Hi-End сектора приносят NVIDIA и ATI до 40% всей прибыли от продаж видеочипов, чтобы бы там ни любили говорить местные продавцы или маркетологи). И следует, разумеется, учитывать то, что в начале продаж цены будут выше, как и всегда бывает с новинками.
В остальном это полностью идентичные по своим возможностям в 3D и 2D чипы (карты). Поэтому если кто не в курсе, что такое G70 (GeForce 7800-серия), то может почитать наш базовый материал по GeForce 7800 GTX.
Перейдем к карте. В отличие от ранее выходивших также базовых материалов, данный обзор будет опираться на тестирование не эталонной карты от NVIDIA, а на серийную плату от Palit. Впрочем, ничего такого, что говорило бы о том, что Palit ее и изготовил, нет. Перед нами будет именно reference card, предлагаемая лишь партнером NVIDIA — компанией Palit. Я уже не один раз говорил, что все Hi-End продукты, что у ATI, что у NVIDIA изготавливаются с самого начала на одной фабрике по заказам самих чипмейкеров, и продаются партнерам не чипы, а уже готовые карты. Лишь потом, через некоторое время (обычно через полгода) ряд крупных производителей начинает самостоятельный выпуск таких карт, а изделия на чипах ATI RADEON X850XT/PE/PRO и вовсе никогда не сходят с производственных линий партнеров ATI (все такие карты они закупают у ATI и продают под своей маркой).
Частоты (чип/физическая по памяти (эффективная по памяти): 400/500 (1000) MHz (номинал — 400/500 (1000) МГц)
Ширина шины обмена с памятью: 256bit
Число вершинных конвейеров: 7
Число пиксельных конвейеров: 20
Размеры: 200x100x15mm (последняя величина — максимальная толщина видеокарты).
Цвет текстолита: зеленый.
Выходные гнезда: 2xDVI, S-Video.
VIVO: есть (Philips 7115)
Сравнение с эталонным дизайном, вид спереди Palit GeForce 7800 GT 256MB Reference card NVIDIA GeForce 7800 GTX Reference card NVIDIA GeForce 6800 Ultra Сравнение с эталонным дизайном, вид сзади Palit GeForce 7800 GT 256MB Reference card NVIDIA GeForce 7800 GTX Reference card NVIDIA GeForce 6800 Ultra Интересно отметить, что дизайн 7800 GT несколько упрощен, относительно 7800 GTX, в частности, PCB рассчитана на монтаж только 256 мегабайт GDDR3 памяти, ее длина сравнялась с длиной 6800 Ultra, однако и, как видно из снимков, относительно последней PCB у 7800 GT упрощена. Кстати, вполне возможен перевод и 6800GT/Ultra на новый более дешевый дизайн, ведь раз он обеспечивает работу карты на частотах 400/1000 МГц, то уж и подавно 6800 GT с его 350/1000 МГц сможет работать (чипы G70 и NV45 совместимы по контактам). Да и 425/1100 МГц у 6800 Ultra смогут без проблем работать с такой PCB. К тому же объявлено уже о предстоящем снижении цен на 100 долларов США на эти карты.
Также стоит упомянуть, что 7800 GT снабжена парой гнезд DVI и имеет контакты для объединения в SLI-тандем.
Давайте сравним с 7800GTX:
Прекрасно видно, что чипы абсолютно идентичны с визуальной точки зрения. Никаких мостиков и различий на подложке GPU не обнаружено. Следовательно, отключение четырех пиксельных и одного вершинного конвейера было сделано или внутри самого кристалла, или с помощью программируемых регистров, или через BIOS. Два последних способа дают шанс на разблокирование. Первый — можно проститься с мечтой о переделке GT в GTX. К прискорбию оверклокеров, выяснится, что именно на первый способ и вышли разработчики из NVIDIA. Но об этом ниже.
В заключение рассмотрения самой карты следует отметить, что она снабжена кодеком, который дает нам VIVO (VideoIn,VideoOut). То есть продукт может на любительском уровне осуществлять видеозахват аналогового сигнала и записывать его в цифровом виде. Мне хочется взять обещание с нашего постоянного автора этой тематики Алексея Самсонова, что, несмотря на всю его занятость, он наконец-то изучит этот кодек и напишет о его возможностях в отдельном материале.
Palit GeForce 7800 GT 256MB Руководство пользователя, CD с драйверами и утилитами, два диска (PowerDVD 5.0, игра XRally), переходник DVI-to-d-Sub, адаптер-разветвитель для HDTV/VIVO. Характеристики
Общие параметры GeForce 7800 GT: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce 7800 GT, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Частота ядра 400 МГц из 2610 (Radeon RX 6500 XT) Количество транзисторов 302 млн из 14400 (GeForce GTX 1080 SLI (мобильная)) Технологический процесс 110 нм из 4 (H100 PCIe) Энергопотребление (TDP) 65 Вт из 900 (Tesla S2050) Скорость текстурирования 8.000 из 939.8 (H100 SXM5) Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce 7800 GTX, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности 990 Соотношение цена-качество 0.15 Архитектура Curie (2003−2013) Графический процессор G70 Тип Десктопная Дата выхода 22 июня 2005 (16 лет назад) Цена на момент выхода 599$ Цена сейчас 50$ (0.1x) из 49999 (A100 SXM4) Для получения индекса мы сравниваем характеристики видеокарт и их стоимость, учитывая стоимость других карт.
Видеовыходы
Перечисляются имеющиеся на GeForce 7800 GTX 512 видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Видеоразъемы 2x DVI, 1x S-Video Совместимость и размеры
Параметры, отвечающие за совместимость GeForce 7800 GTX 512 с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Интерфейс PCIe 1.0 x16 Длина 228 мм Толщина 2 слота Характеристики
Общие параметры GeForce 7800 GTX: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce 7800 GTX, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Частота ядра 430 МГц из 2610 (Radeon RX 6500 XT) Количество транзисторов 302 млн из 14400 (GeForce GTX 1080 SLI (мобильная)) Технологический процесс 110 нм из 4 (H100 PCIe) Энергопотребление (TDP) 86 Вт из 900 (Tesla S2050) Скорость текстурирования 10.32 из 939.8 (H100 SXM5) FarCry, Pier
Мы видим, что эмуляция 7800GT также удалась, разница в производительности между ней и реальным 7800GT не превышает 5%. Что касается остальных сравнений, то, во-первых, следует отметить, что режимы без АА+АФ учитывать вообще не следует, поскольку там все упирается в CPU, а во-вторых, даже АА+АФ не способны так сильно нагрузить карты, к сожалению, режимы АА выше 4х уже у ATI и NVIDIA сильно различаются. Плюс надо сказать, что исследуя производительность в Far Cry за последний год, нам давно стало ясно, что эта игра стала коньком канадской компании, отладившей свои драйвера в этой игре до блеска. И давно уже продукты ATI в равной ценовой категории превосходят изделия NVIDIA в данном тесте. Поэтому отставание 7800 GT от X850 XT PE, и примерный паритет с X850 XT — не вызывают удивления. Это нормально. К тому же, все равно ценовой фактор говорит в пользу 7800 GT (не будем забывать и про потенциал HDR, который может работать на картах NVIDIA в этой игре).
TR:AoD, Paris5_4 DEMO
Прежде всего, стоит сказать, что эмуляция 7800GT от натурального продукта практически не отличается по производительности. Что касается соперничества с ATI, то оно очень успешное: победа даже над X850 XT PE. Разумеется, 7800 GT занял промежуточное место между 6800 Ultra и 7800 GTX. Отмечу, как очень важный фактор, что ПСП у 7800 GT меньше чем у 6800 Ultra! Поэтому в приложениях, где производительность сильно зависит от ПСП, может быть даже отставание от NV45 (хотя такие игры уже постепенно уходят в прошлое, на сцену все больше выходит игр, преимущественно нагружающих шейдерные блоки). В данном случае эта игра целиком и полностью зависит от производительности именно таких блоков, и потому мы видим сильное опережение 7800 GT против 6800 U, несмотря на более низкую ПСП.
Игровые тесты, сильно нагружающие блоки вершинных шейдеров, смешанно блоки пиксельных шейдеров 1.1 и 2.0, активное мультитекстурирование.
Видеовыходы
Перечисляются имеющиеся на GeForce 7800 GTX видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Видеоразъемы 2x DVI, 1x S-Video Читайте также: