Какие видеокарты поддерживают nvidia flex
GeForce 472.12 WHQL стал последним видеодрайвером для графических адаптеров семейства Kepler.
Сегодня вышел новый драйвер GeForce 496.13 WHQL, который оптимизировал производительность, исправил мелкие баги и добавил поддержку DLSS в десятку новых игр.
К тому же свежее обновление стало первым, которое обошло стороной старые видеокарты серии GTX 600, GTX 700 и Titan. Критические обновления безопасности для чипов Kepler будут выходить вплоть до сентября 2024 года.
Список графических устройств построенных на архитектуре Kepler выглядит следующим образом:
- Titan: GeForce GTX Titan, GeForce GTX Titan Black и GeForce GTX Titan Z;
- GeForce 700: GeForce GTX 780 Ti, GeForce GTX 780, GeForce GTX 770, GeForce GTX 760, GeForce GTX 760 Ti (OEM), GeForce GT 740, GeForce GT 730, GeForce GT 720 и GeForce GT 710;
- GeForce 600: GeForce GTX 690, GeForce GTX 680, GeForce GTX 670, GeForce GTX 660 Ti, GeForce GTX 660, GeForce GTX 650 Ti BOOST, GeForce GTX 650 Ti, GeForce GTX 650, GeForce GTX 645, GeForce GT 640, GeForce GT 635 и GeForce GT 630.
Графические адаптеры GeForce GTX 750 Ti, GeForce GTX 750 и GeForce GTX 745 являются исключением, так как они базируются на архитектуре Maxwell.
Странно, у меня все пашет и картинка корректно отображается. o.o
Первое поколение Титана. Карта за штуку баксов или 30000 рублей.
Вроде только недавно это было.
Сейчас больно было.
О да. Время беспощадно . (=
Легенд не оставляют позади
Моей 750ти тоже нету в списке
Умрет она только вместе с 900 серией
Она на базе Maxwell.
Потому что это Maxwell
про нее просто уже давно не вспоминают
Вот же дерьмо, и как теперь моя GTX 680 работать будет без обновлений драйверов. думаю, все так же отлично!
2 гига передают привет кста
Прощай, старичек 630 - ты выручал меня в то время, когда на хороший комп у меня денег не было, а играть так хотелось.
хорошая карта ,помню ещё двухчиповую GTX 690 вот зверюга была.
я отберу у тебя rtx
Карточки вроде 610- 750ti еще можно найти в магазинах. Но нвидия как бы пох
Она на максвелле
750 Ti еще поддерживают, ибо это Maxwell. (=
210 также в продаже можно поискать.
и главное ни одной карты от AMD в списке нет, теперь понятно кому не все-равно на своих потребителей
Так толсто, что даже тонко.
В середине лета этого года мою 1060 посетил мистер отвалец, искал временную затычку, из мусора до 5к на авито нашел MSI OEM Nvidia GTX745 2GB GDDR3 128Bit низкопрофильную за 3к. Стриминг и рендеринг работает также как на 1060, благодаря NVENC, а вот игровая составляющая везде разная. Пока не нашел мастерскую, куда оттащить 1060, 745 трудится непокладая рук.
1060 отвалами не страдает. У тебя либо чипы памяти сдохли, либо что-то с подсистемой питания. Либо в результате проблем с подсистемой питания на графический проц прилетело повышенное напряжение, что могло его убить. Но точно не отвал.
Поддержку прекратили, а драйвера выросли в объеме на ~200мб
последний драйвер обычно на будущее клепают, на радеонах hd 6 серии, например, у них из-за fps режется в разы, приходится более старые дрова смотреть, чтобы и fps был норм, и артефактов всяких не было.
Вот суки, эти видяхи стоят как автомобиль, а они еще кол в жопу и сердце втыкают
9 лет чувак Да и не нужны им больше обновления драйверов Ибо даже топы уже с трудом игры тянут Сам сидел gtx 760 до 19 года Хорошая видеокарта была.
как будто после прекращения поддержки дровами видеокарта перестанет работать) А требования конкретной версии драйвера в играх обходятся проще простого - изменением одной цифры в реестре, где прописана версия установленного в данный момент драйвера.
У меня gtx 660ti. Вот гады. Принципиально не буду покупать новую пока рынок не стабилизируется. Видюху по цене топового компа дикая дичь , покупать. Ну если только бабок совсем много лишних. Тогда лучше авто обновить :) меня кстати большеивсего возмутило выпиливание 3dtv из дров кроме топовой линейки. Типа технология умерла хотел поиграть в overload в очках на своем самсунге, и не смог. Нужен даунгрейд но у меня не вышло , не включается 3д.
Не обновлял дрова для 770 с 2018 года, ибо после обновления стало снимать по 5-7 fps в отдельных игорах. После перехода на 10-ку винда мне раз сама обновила драйвер видюхи на свежий и я это заметил как раз по просадке fps)
All games, monitors, and mice are tested for quality and compatibility with NVIDIA Reflex.
- NVIDIA Reflex Games
- NVIDIA Reflex Compatible Mice
- NVIDIA Reflex Compatible Monitors
NVIDIA Reflex Low Latency mode is supported on GeForce 900 Series GPUs and newer*.
*Rainbow Six Siege with Reflex requires GeForce 10 Series and newer.
Vendor | Mouse | Supports Wired | Supports Wireless | FW Version |
---|---|---|---|---|
Acer | Predator Cestus 330 | Yes | N/A | 0108 |
Acer | Predator Cestus 350 | Yes | Yes* | 0121 |
Alienware | AW320M | Yes | N/A | 0.2.6.31 |
Alienware | AW610M | Yes | Yes | Mouse: 1.3.8.38 Dongle: 1.3.3.23 |
Alienware | AW720M | Yes | Yes | Mouse: 1.2.19.0 Dongle: 0.2.9.0 |
AOC | GM500 Gaming Mouse | Yes | N/A | 2.02 |
AOC | GM510 Gaming Mouse | Yes | N/A | 114 |
AOPEN | Fire Legend GM310 | Yes | N/A | 0104 |
Asus | ROG Chakram | Yes | Yes* | 13.11.32 |
Asus | ROG Chakram Core | Yes | N/A | 1.00.08 |
Asus | ROG Gladius III | Yes | N/A | 1.00.16 |
Asus | ROG Gladius III Wireless | Yes | Yes* | 12.01.34 |
Asus | ROG Keris | Yes | N/A | 1.00.08 |
Asus | ROG Keris Wireless | Yes | Yes* | 1.31.14 |
Asus | ROG Spatha X | Yes | Yes* | 11.71.26 |
Corsair | DARK CORE RGB PRO | Yes | Yes | Mouse: 2.7.37 Dongle: 2.4.14 |
Corsair | DARK CORE RGB PRO SE | Yes | Yes | Mouse: 2.7.37 Dongle: 2.4.14 |
Corsair | KATAR PRO WIRELESS | N/A | Yes | Mouse: 2.1.14 Dongle: 2.2.23 |
Corsair | KATAR PRO XT | Yes | N/A | 1.5.24 |
Corsair | M65 RGB ELITE | Yes | N/A | 3.41 |
Corsair | NIGHTSWORD RGB | Yes | N/A | 3.41 |
Corsair | SABRE PRO CHAMPION SERIES | Yes | N/A | 1.9.23 |
Corsair | SABRE RGB PRO CHAMPION SERIES | Yes | N/A | 1.9.23 |
EVGA | X12 | Yes | N/A | 1.77 |
EVGA | X15 | Yes | N/A | 1.24 |
EVGA | X17 | Yes | N/A | 1.68.1 |
HyperX | Pulsefire Haste | Yes | N/A | 1.1.0.6 |
Logitech G | Pro X Superlight | Yes | Yes* | 25.0.12 |
Logitech G | G303 Shroud Edition | Yes | Yes* | Mouse: 29.0.15 Dongle: 4.2.9 |
MSI | CLUTCH GM41 LIGHTWEIGHT | Yes | N/A | 1.03 |
MSI | CLUTCH GM41 LIGHTWEIGHT V2 | Yes | N/A | 1.03 |
MSI | CLUTCH GM41 LIGHTWEIGHT WIRELESS | Yes | Yes | Mouse: 0091 Dongle: 0091 |
Razer | Basilisk Ultimate | Yes | Yes* | 1.07.01 |
Razer | DeathAdder V2 | Yes | N/A | 1.04.00 |
Razer | DeathAdder V2 Pro | Yes | Yes* | 2.02.01 |
Razer | Viper Ultimate | Yes | Yes* | 1.05.00 |
ROCCAT | BURST PRO | Yes | N/A | 1.09 |
ROCCAT | KONE PRO | Yes | N/A | 1.93 |
ROCCAT | KONE PRO AIR | Yes | Yes* | 4.30 |
ROCCAT | Kone XP | Yes | N/A | 1.08 |
SteelSeries | Rival 3 | Yes | N/A | 0.37.0.0 |
*Average latency provided by Reflex Analyzer database.
Vendor | Model | Hz | Resolution | Size |
---|---|---|---|---|
Acer | Predator X25 | 360 | 1080p | 24.5" |
Acer | Predator X28 | 152 | 4K | 28" |
Acer | Predator X32 | 160 | 4K | 32" |
Acer | Predator X34S | 180 | 1440p Ultra-wide | 34" |
Acer | Predator X38S | 175 | 1600p Ultra-wide | 37.5" |
Acer | Predator XB273U NX | 240 | 1440p | 27" |
AOC | AOC AGON PRO 27" G-SYNC ULTIMATE Gaming Monitor (AG274QG) | 240 | 1440p | 27" |
AOC | AOC AGON PRO 25" G-SYNC Gaming Monitor (AG254FG) | 360 | 1080p | 24.5" |
AOC | AG274QGM - AGON PRO Mini LED MONITOR | 300 | 1440p | 27" |
Asus | ROG Swift PG279QM | 240 | 1440p | 27" |
Asus | ROG Swift 360Hz PG259QNR | 360 | 1080p | 24.5" |
Asus | ROG Swift PG27AQN | 360 | 1440p | 27" |
Asus | ROG Swift PG32UQXE | 160 | 4k | 32" |
Dell | ALIENWARE 25 GAMING MONITOR – AW2521H | 360 | 1080p | 24.5" |
HP | OMEN by HP 32u 4k MiniLED Gaming Monitor | TBD | 4K | 32" |
Lenovo | Legion Y25G-30 | 360 | 1080p | 24.5" |
MSI | Oculux NXG253R | 360 | 1080p | 24.5" |
MSI | MEG 271Q Mini LED | 300 | 1440p | 27" |
Viewsonic | ELITE XG251G | 360 | 1080p | 24.5" |
Viewsonic | ELITE XG271QG | 240 | 1440p | 27" |
Viewsonic | ELITE XG272G | 300 | 1440p | 27" |
Maxwell
В 2014 году Nvidia выпустила GPU десятого поколения под названием Maxwell. Как говорится в технической документации GM107 [8] , девизом первого поколения архитектуры стали «Максимальная энергоэффективность и чрезвычайная производительность на каждый потреблённый ватт». Карты позиционировались для «ограниченных в мощности сред, таких как ноутбуки и PC с малым форм-фактором (small form factor, SFF)».
Важнейшим решением стал отказ от структуры Kepler с количеством ядер CUDA в SM, не являющимся степенью двойки: некоторые ядра стали общими и вернулись в работе в режиме половины warp-ов. Впервые за всю историю архитектуры SMM имел меньше ядер, чем его предшественник: «всего» 128 ядер.
Согласование количества ядер и размера warp-ов улучшило сегментацию кристалла, что привело к экономии площади и энергии.
Один SMM 2014 года имел столько же ядер (128), сколько вся карта GTX 8800 в 2006 году.
Второе поколение Maxwell (описанное в технической документации GM200 [9] ) значительно повысило производительность, сохранив при этом энергоэффективность первого поколения.
Техпроцесс оставался на уровне 28 нанометров, поэтому инженеры Nvidia не могли для повышения производительности прибегнуть к простой миниатюризации. Однако уменьшение количества ядер SMM снизило их размер, благодаря чему на кристалле удалось разместить больше SMM. По сравнению с Kepler, второе поколение Maxwell удвоило количество SMM, при этом всего на 25% увеличив площадь кристалла.
В списке усовершенствований также можно найти упрощённую логику диспетчеризации, позволившую снизить количество избыточных повторных вычислений диспетчеризации и задержку вычислений, что обеспечило повышение оптимальности использования warp-ов. Также на 15% была увеличена частота памяти.
Изучение структурной схемы Maxwell GM200 уже начинает напрягать глаза. Но мы всё равно внимательно его исследуем. Флагманская карта NVIDIA GeForce GTX 980 Ti с кристаллом GM200 и 24 SMM обещала 3072 ядер и 6 060 гигафлопс [10] .
GM200, установленный в GeForce GTX 980 Ti.
Какие игры поддерживают NVIDIA Reflex
На текущий момент NVIDIA Reflex поддерживается в Fortnite, Valorant, Call of Duty: Warzone, Call of Duty: MW 2019, Call of Duty: Cold War, Destiny 2 и Apex Legends. В ближайшее время поддержка технологии появится в сетевых шутерах Overwatch и Rainbow Six: Siege. А Warzone, к слову, в скором времени получит еще и поддержку DLSS 2.0, что должно привести к получению еще большего фреймрейта для плавного гейминга.
Делитесь мнениями в комментариях на тему того, что думаете о технологии Reflex от NVIDIA. Пообсуждаем: стоит сия технология свеч? Или все это лишь очередная маркетинговая уловка, чтобы улучшить продажи 144/240/360-герцовых мониторов. Как думаете?
Последние выходные я потратил на освоение программирования CUDA и SIMT. Это плодотворно проведённое время закончилось почти 700-кратным ускорением моего «рейтрейсера на визитке» [1] — с 101 секунд до 150 мс.
Такой приятный опыт стал хорошим предлогом для дальнейшего изучения темы и эволюции архитектуры Nvidia. Благодаря огромному объёму документации, опубликованному за долгие годы «зелёной» командой, мне удалось вернуться назад во времени и вкратце пройтись по удивительной эволюции её потоковых мультипроцессоров.
В этой статье мы рассмотрим:
Pascal
В 2016 году Nvidia представила Pascal. Техническая документация GP104 [11] оставляет ощущение дежавю, потому что Pascal SM выглядит точно так же, как Maxwell SMM. Отсутствие изменений SM не привело к стагнации производительности, потому что 16-нанометровый техпроцесс позволил разместить больше SM и снова удвоить количество гигафлопс.
Среди других серьёзных улучшений была система памяти, основанная на совершенно новой GDDR5X. 256-битный интерфейс памяти благодаря восьми контроллерам памяти обеспечивал скорости передачи в 10 гигафлопс, увеличив на 43% пропускную способность памяти и снизив время простоя warp-ов.
Флагман NVIDIA GeForce GTX 1080 Ti с кристаллом GP102 и 28 TSM обещал 3584 ядер и 11 340 гигафлопс [12] .
GP104, установленный в GeForce GTX 1080.
Тупик
Вплоть до 2006 года архитектура GPU компании NVidia коррелировала с логическими этапами API рендеринга [2] . GeForce 7900 GTX, управлявшаяся кристаллом G71, состояла из трёх частей, занимавшихся обработкой вершин (8 блоков), генерацией фрагментов (24 блоков), и объединением фрагментов (16 блоков).
Кристалл G71. Обратите внимание на оптимизацию Z-Cull, отбрасывающую фрагмент, не прошедший бы Z-тест.
Эта корреляция заставила проектировщиков угадывать расположение «узких места» конвейера для правильной балансировки каждого из слоёв. С появлением в DirectX 10 ещё одного этапа — геометрического шейдера, инженеры Nvidia столкнулись со сложной задачей балансировки кристалла без знания того, насколько активно будет использоваться этот этап. Настало время для перемен.
О принципе работы NVIDIA Reflex
Да, отзывчивость растёт при повышении числа кадров, но между FPS и задержками управления не всегда наблюдается строго линейная зависимость. Задержки управления формируются из многих частей, и основное время уходит на обработку игры. По умолчанию процессор готовит физику, баллистику и игровую логику для нескольких кадров наперёд, чтобы видеокарта могла спокойно работать, не простаивая в ожидании данных от процессора. Проще говоря, между процессором и видеокартой есть очередь, а значит, результат нажатия на кнопку отобразится только через 3-4 кадра, а не 1. NVIDIA Reflex добавляется разработчиком в движок игры и позволяет решить эту проблему.
Суть технологии проста — за несколько миллисекунд до того, как видеокарта закончит отрисовывать кадр, Reflex сигнализирует процессору о необходимости начать обработку управления и подготовку данных для следующего кадра. Таким образом, вышеупомянутая очередь кадров буквально сводится к нулю, что положительно сказывается на задержках. Насколько — судите сами:
Support
Помимо трассировки лучей и сглаживания DLSS 2.0 на базе ИИ, современные видеоигры (в частности, Fortnite) поддерживают еще и технологию NVIDIA Reflex, которая призвана снизить системную задержку, возникающую между нажатием на кнопку и отображением действия на экране (например: нажал клавишу мыши — произошел выстрел).
Измерить «задержку ввода» непросто, поэтому в рамках NVIDIA Reflex используется комплекс программно-аппаратных средств. Сначала поговорим про новые 360-герцовые мониторы для киберспорта с модулем G-Sync, на котором работает Reflex Latency Analyzer. Помимо очевидных преимуществ высокой частоты обновления в соревновательных играх, «анализатор задержек», интегрированный в дисплей, позволяет измерять задержку поддерживаемых мышек, которые подключаются к монитору, задержку ПК и задержку отображения кадра на дисплее.
Вся эта статистика выводится через интерфейс GeForce Experience. При помощи анализа задержек на разных этапах киберспортсмены и профессиональные игроки могут улучшить свои тактики, оптимизировать игровые настройки, либо собрать ПК с наименьшими задержками.
Turing
Выпуском в 2018 году Turing компания Nvidia произвела свой «крупнейший за десять лет архитектурный шаг вперёд» [13] . В «Turing SM» появились не только специализированные ядра Tensor с искусственным интеллектом, но и ядра для трассировки лучей (rautracing, RT). Такая фрагментированная структура напоминает мне многослойную архитектуру, существовавшую до Tesla, и это ещё раз доказывает, что история любит повторения.
Кроме новых ядер, в Turing появилось три важные особенности. Во-первых, ядро CUDA теперь стало суперскалярным, что позволяет параллельно выполнять инструкции с целыми числами и с числами с плавающей запятой. Если вы застали 1996 год, то это может напомнить вам об «инновационной» архитектуре Pentium компании Intel.
Во-вторых, новая подсистема памяти на GDDR6X, поддерживаемая 16 контроллерами, способна теперь обеспечивать 14 гигафлопс.
В-третьих, потоки теперь не имеют общих указателей инструкций (IP) в warp-е. Благодаря появившейся в Volta диспетчеризации Independent Thread Scheduling, каждый поток имеет собственный IP. В результате этого SM способны гибче настраивать диспетчеризацию потоков в warp-е без необходимости как можно более быстрого их схождения.
Флагманская карта NVIDIA GeForce GTX 2080 Ti с кристаллом TU102 и 68 TSM имеет 4352 и достигает 13 45 гигафлопс [14] . Я не стал рисовать структурную схему, потому что она выглядела бы как размытое зелёное пятно.
Kepler
В 2012 году Nvidia выпустила архитектуру Kepler, названную в честь астролога, наиболее известного открытием законов движения планет. Как обычно, взглянуть внутрь нам позволила техническая документация GK104 [6] .
В Kepler компания Nvidia значительно улучшила энергоэффективность кристалла, снизив тактовую частоту и объединив частоту ядер с частотой карты (ранее их частота различалась вдвое).
Такие изменения должны были привести к снижению производительности. Однако благодаря вдвое уменьшившемуся техпроцессу (28 нанометров) и замене аппаратного диспетчера на программный, Nvidia смогла не только разместить на чипе больше SM, но и улучшить их конструкцию.
Next Generation Streaming Multiprocessor (SMX) — это монстр, почти все показатели которого были удвоены или утроены.
Благодаря четырём диспетчерам warp-ов, способным на обработку целого warp-а за один такт (Fermi мог обрабатывать только половину warp-а), SMX теперь содержал 196 ядер. Каждый диспетчер имел двойную диспетчеризацию, позволявшую выполнять вторую инструкцию в warp-е, если она была независима от текущей исполняемой инструкции. Двойная диспетчеризация была не всегда возможна, потому что один столбец из 32 ядер был общим для двух операций диспетчеризации.
Такая схема усложнила логику диспетчеризации (к этому мы ещё вернёмся), но благодаря выполнению до шести инструкций warp-ов за такт SMX обеспечивал удвоенную производительность по сравнению с SM архитектуры Fermi.
Заявлялось, что флагманская NVIDIA GeForce GTX 680 с кристаллом GK104 и восемью SMX имеет 1536 ядер, достигающими 3 250 гигафлопс [7] . Элементы кристалла стали настолько запутанными, что мне пришлось убрать со схемы все подписи.
GK104, установленный в GeForce GTX 680.
Обратите внимание на полностью переделанные подсистемы памяти, работающие с захватывающей дух частотой 6 ГГц. Они позволили снизить количество контроллеров памяти с шести до четырёх.
Что ждёт нас дальше
По слухам, следующая архитектура под кодовым названием Ampere будет объявлена в 2020 году. Так как Intel доказала на примере Ice Lake, что по-прежнему существует потенциал миниатюризации при помощи 7-нанометрового техпроцесса, почти нет сомнения в том, что Nvidia использует его для дальнейшего уменьшения SM и удвоения производительности.
Интересно будет посмотреть, как Nvidia продолжит эволюцию идеи кристаллов, имеющих три типа ядер, выполняющих разные задачи. Увидим ли мы кристаллы, целиком состояние из Tensor-ядер или RT-ядер? Любопытно.
Каждый киберспортсмен и любитель онлайн-игр знает, что отвешивать хедшоты намного приятнее, когда в игре высокая частота кадров. Всё просто: высокий FPS позволяет быстрее замечать врагов, упрощает прицеливание и повышает кучность стрельбы, в результате растёт число фрагов. Чтобы выжать фреймрейт до последнего кадра, профессионалы не скупятся на дорогое железо, ведь даже с микроскопическими фризами достичь максимального результата невозможно. Но что делать простым смертным? Как оказалось, есть другие способы получить преимущество. Например, можно просто включить NVIDIA Reflex. Рассказываем, что это за технология и как она работает.
Products
Какие видеокарты поддерживают NVIDIA Reflex и как ее включить
Теперь про программную составляющую NVIDIA Reflex, которая уменьшает системную задержку и, как следствие, делает управление более отзывчивым. Сначала отмечу, что сама технология NVIDIA Reflex поддерживается всеми картами, начиная с поколения Maxwell (карты 900-й серии), и не требует наличия G-Sync-монитора или какого-либо другого оборудования, кроме видеокарты NVIDIA. Чтобы получить отзывчивое управление в игре с поддержкой Reflex, достаточно залезть в графические настройки игры и включить соответствующую опцию.
Fermi
Tesla была рискованным ходом, оказавшимся очень успешным. Она была настолько успешной, что стала фундаментом для GPU компании NVidia на следующие два десятка лет.
«Хотя с тех пор мы, конечно же, внесли серьёзные архитектурные изменения (Fermi была серьёзным изменением архитектуры системы, а Maxwell стал ещё одним крупным изменением в проектировании процессоров), фундаментальная архитектура, представленная нами в G80, и сегодня осталась такой же [Pascal]».
В 2010 году Nvidia выпустила GF100, основанный на совершенно новой архитектуре Fermi. Внутренности её последнего чипа подробно описаны в технической документации Fermi [4] .
Модель выполнения по-прежнему основана на warp-ах из 32 потоков, диспетчеризируемых в SM. NVidia удалось удвоить/учетверить все показатели только благодаря 40-нанометровому техпроцессу. Благодаря двум массивам из 16 ядер CUDA, SM теперь мог одновременно диспетчеризировать два полу-warp-а (по 16 потоков). При том, что каждое ядро выполняло по одной инструкции за такт, SM по сути был способен исключать по одной инструкции warp за такт (в четыре раза больше, чем у SM архитектуры Tesla).
Количество SFU также увеличилось, однако не так сильно — мощность всего лишь удвоилась. Можно прийти к выводу, что инструкции такого типа использовались не очень активно.
Присутствует полуаппаратная поддержка float64, при которой комбинируются операции, выполняемые двумя ядрами CUDA. Благодаря 32-битном АЛУ (в Tesla оно было 24-битным) GF100 может выполнять целочисленное умножение за один такт, а из-за перехода от IEEE 754-1985 к IEEE 754-2008 имеет повышенную точность при работе с конвейером float32 при помощи Fused Multiply-Add (FMA) (более точного, чем используемое в Tesla MAD).
С точки зрения программирования, объединённая система памяти Fermi позволила дополнить CUDA C такими возможностями C++, как объект, виртуальные методы и исключения.
Благодаря тому, что текстурные блоки стали теперь SM, от концепции TPC отказались. Она была заменена кластерами Graphics Processor Clusters (GPC), имеющими по четыре SM. И последнее — SM теперь одарён Polymorph Engine, занимающимся получением вершин, преобразованием окна обзора и тесселяцией. Карта-флагман GeForce GTX 480 на основе GF100 рекламировалась, как содержащая 512 ядер и способная обеспечить 1 345 гигафлопс [5] .
GF100, установленный в GeForce GTX 480. Обратите внимание на шесть контроллеров памяти, обслуживающих GPC.
Как включить NVIDIA Reflex в играх
Чтобы улучшить отзывчивость управления при помощи «рефлекса», обладателям поддерживаемых GeForce достаточно открыть настройки игры и найти строку с названием NVIDIA Reflex Low Latency Mode. Обычно эта строка скрывается в графических параметрах.
Фото: Настройки NVIDIA Reflex в Rainbow Six Siege
NVIDIA Reflex имеет две опции на выбор — «Вкл» и «Вкл + Boost». Первая просто включает NVIDIA Reflex, конечный результат — улучшение отзывчивости управления. Вторая опция не позволяет видеокарте понижать частоты, когда производительность упирается в центральный процессор, что делает задержки ещё ниже. Второй режим немного увеличивает энергопотребление из-за более высоких частот, что может быть критично при игре на ноутбуке от батареи. Рекомендую опцию «Вкл (Усилено)» на ПК, и просто «Вкл» для ноутбуков при работе от батареи.
Call of Duty: Warzone, Rainbow Six Siege, Fortnite, Rust, War Thunder, Enlisted и некоторые другие игры с NVIDIA Reflex также поддерживают NVIDIA DLSS. Включение NVIDIA DLSS вместе с Reflex даёт наилучшую отзывчивость управления на видеокартах GeForce RTX за счёт повышения частоты кадров до двух раз в режиме DLSS «Производительность».
Напомню, что такое NVIDIA DLSS, если вы не в курсе. Это снискавшая любовь и популярность среди геймеров технология для повышения производительности в играх. В основе технологии лежит обученная на высококачественных примерах нейросеть, которая ускоряется на тензорных ядрах видеокарт RTX. Нейросеть DLSS не выдумывает и не интерполирует недостающие пиксели, в отличие от апскейлинга. Вместо этого нейросеть ищет недостающие пиксели в предыдущих кадрах и вставляет их в нужные места в новом кадре, в итоге картинку не отличить от рендеринга в нативном разрешении, а производительность может быть до двух раз выше.
Как работает технология NVIDIA Reflex: разбираем на практике
Когда производительность упирается в центральный процессор, CPU готовит команды для видеокарты с запасом на 1-3 кадра (обрабатывает игровые данные, рассчитывает баллистику, готовит списки команд для графического адаптера). Для этого приходится захватывать управление на несколько кадров подряд, обрабатывать физику и игровую логику на процессоре на несколько кадров вперед и ждать пока видеокарта выведет все эти кадры на дисплей. Как следствие — задержки увеличиваются в несколько раз и отзывчивость управления падает. Инструменты NVIDIA Reflex позволяют разработчикам избавиться от этой очереди из нескольких кадров.
Используя инструменты Reflex, игровой движок начинает готовить команды на процессоре за несколько миллисекунд до того, как видеокарта закончит рендеринг текущего кадра. Подобное умное планирование устраняет очередь из нескольких кадров на рендеринг — управление захватывается для одного кадра, процессор считает игровую логику и физику для одного кадра, составляет список команд на отрисовку для GPU и сразу передает эти команды видеокарте без какой-либо очереди. Таким образом системная задержка сокращается в несколько раз.
Где и на чём поиграть?
Разработчики быстро оценили преимущества, которые дает NVIDIA Reflex, в результате технологию уже можно найти в 20 популярных соревновательных играх. А именно в Apex Legends, Call of Duty Warzone, Escape from Tarkov, Fortnite, Rainbow Six Siege, Warface, War Thunder и не только. Этот список ежемесячно пополняется новыми хитами, такими как недавно анонсированный Battlefield 2042.
Вопреки некоторым заблуждениям, для NVIDIA Reflex не требуется специальное оборудование, будь то монитор или мышка. Более того, технология работает на всех картах NVIDIA, начиная с GeForce GTX 9хх серии.
Прямая зависимость задержек от частоты кадров никуда не делась, поэтому наименьшие задержки по-прежнему будут на самых быстрых GPU — сейчас это GeForce RTX 30-й серии. Впрочем, и на видеокартах прошлого поколения технология показывает хорошие результаты.
Community & News
Tesla
Nvidia решила проблему роста сложности при помощи «объединённой» архитектуры Tesla, выпущенной в 2006 году.
В кристалле G80 больше не было различий между слоями. Благодаря возможности выполнения вершинного, фрагментного и геометрического «ядра», потоковый мультипроцессор (Stream Multiprocessor, SM) заменил все существовавшие ранее блоки. Уравновешивание нагрузки выполнялось автоматически, благодаря замене выполняемого каждым SM «ядра» в зависимости от требований конвейера.
«Фактически, мы выбросили всю шейдерную архитектуру NV30/NV40 и с нуля создали новую, с новой общей архитектурой универсальных процессоров (SIMT), в которой также были введены новые методологии проектирования процессоров».
Больше не имеющие возможности выполнять инструкции SIMD «блоки шейдеров» превратились в «ядра», способные выполнять по одной целочисленной инструкции или по одной инструкции с float32 за такт. SM получает потоки в группах по 32 потока, называемых warp. В идеале все потоки одного warp выполняют одновременно одну и ту же инструкцию, только для разных данных (отсюда и название SIMT). Многопотоковый блок инструкций (Multi-threaded Instruction Unit, MT) занимается включением/отключением потоков в warp-е в случае, если их указатель инструкций (Instruction Pointer, IP) сходится/отклоняется.
Два блока SFU помогают выполнять сложные математические вычисления, например, обратный квадратный корень, sin, cos, exp и rcp. Эти блоки также способны выполнять по одной инструкции за такт, но поскольку их только два, скорость выполнения warp-а делится на четыре. Аппаратная поддержка float64 отсутствует, вычисления выполняются программно, что сильно влияет на скорость выполнения.
SM реализует свой максимальный потенциал, когда способен скрывать задержки памяти благодаря постоянному наличию диспетчеризируемых warp-ов, но также когда поток в warp-е не отклоняется (управляющая логика удерживает его на одном пути выполнения инструкций). Состояния потоков хранятся в 4-килобайтных файлах регистров (Register File, RF). Потоки, занимающие слишком большое пространство в стеке, снижают количество возможных потоков, которые могут выполняться одновременно, понижая при этом производительность.
Кристаллом-флагманом поколения Tesla был 90-нанометровый G80, представленный в GeForce 8800 GTX. Два SM объединены в кластер обработки текстур (Texture Processor Cluster, TPC) вместе с текстурным блоком (Texture Unit) и кешем Tex L1. Обещалось, что G80 с 8 TPC и 128 ядрами генерирует 345,6 гигафлопс [3] . Карта 8800 GTX была в своё время чрезвычайно популярна, она получила замечательные отзывы и полюбилась тем, кто мог себе её позволить. Она оказалась таким превосходным продуктом, что спустя тринадцать месяцев после выпуска оставалась одним из самых быстрых GPU на рынке.
G80, установленный в 8800 GTX. Render Output Units (ROP) занимаются выполнением сглаживания.
Вместе с Tesla компания Nvidia представила язык программирования C для Compute Unified Device Architecture (CUDA) — надмножество языка C99. Это понравилось энтузиастам GPGPU, приветствовавшим альтернативу обмана GPU при помощи текстур и шейдеров GLSL.
Хотя в этом разделе я в основном рассказываю о SM, это была только одна половина системы. В SM необходимо передавать инструкции и данные, хранящиеся в памяти GPU. Чтобы избежать простоев, GPU не пытаются минимизировать переходы в память при помощи больших кешей и прогнозирования, как это делают CPU. GPU пользуются задержкой, насыщая шину памяти для удовлетворения потребностей ввода-вывода тысяч потоков. Для этого кристалл (например, G80) реализует высокую пропускную способность памяти при помощи шести двусторонних шин памяти DRAM.
GPU пользуются задержками памяти, в то время как CPU скрывают их при помощи огромного кеша и логике прогнозирования.
Как сделать NVIDIA Reflex ещё эффективнее?
Инициативу NVIDIA Reflex по уменьшению задержек подхватили не только разработчики игр, но и производители железа. Так, помимо мощных видеокарт, многие игровые ноутбуки комплектуются матрицами с высокой герцовкой и поддержкой адаптивной синхронизации G-Sync. Не остались в стороне и производители мониторов. Топовые модели для киберспорта оснащаются матрицами с рекордной частотой обновления 360 Гц и имеют G-Sync модули для адаптивной синхронизации на всём диапазоне частот, устранения остаточных следов и анализа задержек при помощи NVIDIA Reflex Latency Analyzer. Последний позволяет подключить поддерживаемую мышку и легко определить задержки управления, что, в свою очередь, даёт возможность оптимальным образом настроить игру и железо. Со списком моделей и совместимых устройств можно ознакомиться на этой странице.
Таким образом, для поклонников соревновательных и киберспортивных игр существует множество инструментов повышения результативности в играх. Комбинация RTX видеокарты, быстрого G-Sync монитора, NVIDIA DLSS и Reflex даёт лучшую в индустрии отзывчивость управления, максимально плавную картинку без разрывов, а также позволяет раньше замечать противников, что наглядно демонстрирует видео ниже.
Читайте также: