Что такое vpu видеокарты

С приходом AMD Radeon RX 5700, новый параметр был представлен в технические характеристики видеокарты что даже не осталось NVIDIA равнодушны, поскольку они тоже поспешили сообщить об этом. Это TGP и в этой статье мы объясним, что это такое, чем оно отличается от TDP и почему вы должны это учитывать.

До сих пор энергопотребление видеокарт было несколько неопределенным из-за NVIDIA, которая начала использовать для обозначения такие сокращения, как TDP. Однако, к счастью, сейчас все изменилось, и NVIDIA, и AMD гораздо более конкретны в этом вопросе, поэтому давайте посмотрим, как TGP имеет отношение ко всему этому.

Тензорные ядра в потребительских GPU (GeForce RTX)

Но что если я куплю графическую карту Nvidia GeForce RTX, не являясь ни астрофизиком, решающим задачи римановых многообразий, ни специалистом, экспериментирующим с глубинами свёрточных нейронных сетей. Как я могу использовать тензорные ядра?

Чаще всего они не применяются для обычного рендеринга, кодирования или декодирования видео, поэтому может показаться, что вы потратили деньги на бесполезную функцию. Однако Nvidia встроила тензорные ядра в свои потребительские продукты в 2018 году (Turing GeForce RTX), внедрив при этом DLSS — Deep Learning Super Sampling.

Принцип прост: рендерим кадр в довольно низком разрешении, а после завершения повышаем разрешение конечного результата так, чтобы он совпадал с «родными» размерами экрана монитора (например, рендерим в 1080p, а затем изменяем размер до 1400p). Благодаря этому повышается производительность, ведь обрабатывается меньшее количество пикселей, а на экране всё равно получается красивое изображение.

Консоли имели такую функцию уже многие годы, и многие современные игры для PC тоже обеспечивают эту возможность. В Assassin's Creed: Odyssey компании Ubisoft можно уменьшить разрешение рендеринга до всего 50% от разрешения монитора. К сожалению, результаты выглядят не так красиво. Вот как игра выглядит в 4K с максимальными настройками графики:

В высоких разрешениях текстуры выглядят красивее, потому что сохраняют в себе больше деталей. Однако для вывода этих пикселей на экран требуется много обработки. Теперь взгляните на то, что происходит при установке рендеринга на 1080p (25% от предыдущего количества пикселей), с использованием шейдеров в конце для растягивания картинки до 4K.

Из-за сжатия jpeg разница может быть заметной не сразу, но видно, что броня персонажа и скала вдали выглядят размытыми. Давайте приблизим часть изображения для более детального изучения:

Изображение слева отрендерено в 4K; изображение справа — это 1080p, растянутые до 4K. Разница гораздо заметнее в движении, потому что смягчение всех деталей быстро превращается в размытую кашу. Частично чёткость можно восстановить благодаря эффекту резкости драйверов графической карты, но лучше бы нам вообще не приходилось этим не заниматься.

Именно здесь в ход идёт DLSS — в первой версии этой технологии Nvidia анализировались несколько выбранных игр; они запускались в высоких разрешениях, низких разрешениях, со сглаживанием и без него. Во всех этих режимах был сгенерирован набор изображений, загруженный затем в суперкомпьютеры компании, которые использовали нейронную сеть, чтобы определить, каким образом лучше всего превратить изображение в разрешении 1080p в идеальную картинку в более высоком разрешении.

Нужно сказать, что DLSS 1.0 не был идеальным: детали часто терялись и в некоторых местах возникало странное мерцание. К тому же он не использовал сами тензорные ядра графической карты (он выполнялся в сети Nvidia) и каждой игре с поддержкой DLSS для генерации алгоритма повышения масштаба требовалось отдельное исследование компанией Nvidia.

Когда в начале 2020 года вышла версия 2.0, в неё были внесены серьёзные улучшения. Самым важным стало то, что суперкомпьютеры Nvidia теперь использовались только для создания общего алгоритма увеличения масштаба — в новой версии DLSS для обработки пикселей с помощью нейронной модели (тензорными ядрами GPU) используются данные из отрендеренного кадра.

Нас впечатляют возможности DLSS 2.0, но пока его поддерживает очень мало игр — на момент написания статьи их было всего 12. Всё больше разработчиков хочет реализовать его в своих будущих играх, и на то есть причины.

Благодаря любому увеличению масштаба можно добиться серьёзного роста производительности, поэтому можно быть уверенными, что DLSS продолжит эволюционировать.

Хотя визуальные результаты работы DLSS не всегда идеальны, освободив занятые рендерингом ресурсы, разработчики смогут добавить больше визуальных эффектов или обеспечить один уровень графики на более широком диапазоне платформ.

Например, DLSS часто рекламируют вместе с трассировкой лучей (ray tracing) в играх с «поддержкой RTX». Карты GeForce RTX содержат дополнительные вычислительные блоки, называемые RT-ядрами, это специализированные логические блоки для ускорения вычислений пересечения луча с треугольником и обхода иерархии ограничивающих объёмов (bounding volume hierarchy, BVH). Эти два процесса являются очень длительными процедурами, определяющими способ взаимодействия света с другими объектами сцены.

Как мы выяснили, ray tracing — очень трудоёмкий процесс, поэтому чтобы обеспечить в играх приемлемый уровень частоты кадров, разработчики должны ограничить количество лучей и выполняемых в сцене отражений. При выполнении этого процесса могут создаваться зернистые изображения, поэтому необходимо применять алгоритм устранения шумов, что повышает сложность обработки. Ожидается, что тензорные ядра повысят производительность этого процесса благодаря устранению шумов с использованием ИИ, однако это ещё предстоит реализовать: большинство современных приложений по-прежнему использует для этой задачи ядра CUDA. С другой стороны, благодаря тому, что DLSS 2.0 становится вполне практичной техникой повышения размера, тензорные ядра можно будет эффективно использовать для повышения частоты кадров после применения в сцене трассировки лучей.

Существуют и другие планы по использованию тензорных ядер карт GeForce RTX, например, улучшение анимаций персонажей или симуляция тканей. Но как и в случае с DLSS 1.0, пройдёт ещё немало времени, прежде чем появятся сотни игр, использующие специализированные матричные вычисления на GPU.

Датчики

Теперь мы переходим на вкладку «Датчики», где можем увидеть подробную информацию о датчики нашей видеокарты, показывая в реальном времени все его параметры вместе с глобальной температурой ЦП. В этом разделе мы можем увидеть информацию о напряжении графического процессора, используемой памяти системы, загрузке контроллера памяти, скорости вентиляторов, максимальной температуре или минимальных частотах, среди других характеристик. При нажатии на значения каждого параметра у нас будет несколько вариантов для более полного контроля над ними.

В случае, если мы заинтересованы в анализе данных графического процессора в более позднее время, приложение позволяет нам сохранить полученные данные в файле журнала. Для этого нужно будет только установить флажок «записывать в файл», который мы находим в нижней левой части окна. Позже нам нужно только выбрать желаемое место для его сохранения, и мы получим файл TXT со всеми данными.

MSI Afterburner

Это одна из наиболее полных программ для мониторинга нашей видеокарты, предлагающая нам полный контроль над ней. Он отвечает за предоставление подробной информации обо всем аппаратном обеспечении, полный мониторинг всех параметров, влияющих на нашу видеокарту, таких как: тактовая частота, Оперативная память использование, скорость вращения вентилятора и загрузка процессора. Мы можем скачать MSI Afterburner из этой ссылке.

Умнее, чем обычный калькулятор?

В мире графики одновременно необходимо передавать и обрабатывать огромные объёмы информации в виде векторов. Благодаря своей способности параллельной обработки GPU идеально подходят для обработки тензоров; все современные графические процессоры поддерживают функциональность под названием GEMM (General Matrix Multiplication).

Это «склеенная» операция, при которой перемножаются две матрицы, а результат затем накапливается с другой матрицей. Существуют важные ограничения на формат матриц и все они связаны с количеством строк и столбцов каждой матрицы.

Требования GEMM к строкам и столбцам: матрица A(m x k), матрица B(k x n), матрица C(m x n)

Алгоритмы, используемые для выполнения операций с матрицами, обычно лучше всего работают, когда матрицы квадратные (например, массив 10 x 10 будет работать лучше, чем 50 x 2) и довольно небольшие по размеру. Но они всё равно будут работать лучше, если обрабатываются на оборудовании, которое предназначено исключительно для таких операций.

В декабре 2017 года Nvidia выпустила графическую карту с GPU, имеющим новую архитектуру Volta. Она была нацелена на профессиональные рынки, поэтому этот чип не использовался в моделях GeForce. Уникальным он был потому, что стал первым графическим процессором, имеющим ядра только для выполнения тензорных вычислений.

Графическая карта Nvidia Titan V, на которой установлен чип GV100 Volta. Да на ней можно запустить Crysis

Тензорные ядра Nvidia были предназначены для выполнения по 64 GEMM за тактовый цикл с матрицами 4 x 4, содержащими значения FP16 (числа с плавающей запятой размером 16 бит) или умножение FP16 со сложением FP32. Такие тензоры очень малы по размеру, поэтому при обработке настоящих множеств данных ядра обрабатывают небольшие части больших матриц, выстраивая окончательный ответ.

В начале этого года архитектура Ampere дебютировала в графическом процессоре дата-центра A100, и на этот раз Nvidia повысила производительность (256 GEMM за цикл вместо 64), добавила новые форматы данных и возможность очень быстрой обработки разреженных тензоров (sparse tensor) (матриц со множеством нулей).

Программисты могут получить доступ к тензорным ядрам чипов Volta, Turing и Ampere очень просто: код всего лишь должен использовать флаг, сообщающий API и драйверам, что нужно применять тензорные ядра, тип данных должен поддерживаться ядрами, а размерности матриц должны быть кратными 8. При выполнении всех этих условий всем остальным займётся оборудование.

Всё это здорово, но насколько тензорные ядра лучше в обработке GEMM, чем обычные ядра GPU?

Когда появилась Volta, сайт Anandtech провёл математические тесты трёх карт Nvidia: новой Volta, самой мощной из линейки Pascal и старой карты Maxwell.

Понятие точности (precision) относится к количеству бит, использованных для чисел с плавающей запятой в матрицах: двойная (double) обозначает 64, одиночная (single) — 32, и так далее. По горизонтальной оси отложено максимальное количество операций с плавающей запятой, выполняемое за секунду, или сокращённо FLOPs (помните, что одна GEMM — это 3 FLOP).

Просто взгляните на результаты при использовании тензорных ядер вместо так называемых ядер CUDA! Очевидно, что они потрясающе справляются с подобной работой, но что же мы можем делать при помощи тензорных ядер?

Графическая карта

В этом разделе мы находим всю подробную информацию о нашей видеокарте. Среди них мы можем подробно увидеть имя, используемую технологию, дату выпуска, тип памяти, сертификацию, производителя, используемую шину, размер и т. Д. Некоторые из наиболее интересных и полезных данных - это частоты как графического процессора, так и в VRAM и особенно Версия BIOS .

Еще один чрезвычайно интересный вариант, который мы сможем выполнить, - это проверка скорости PCIe в стрессовых условиях. Чтобы получить к нему доступ, мы должны нажать на вопросительный знак, который мы находим рядом с полем «Интерфейс шины».

Все подробности, чтобы узнать больше о нашей графике с GPU-Z

После запуска приложения появляется его главное меню с простым интерфейсом, где вся информация отображается на четырех вкладках. Здесь мы найдем функции «Видеокарта», «Датчики», «Дополнительно» и «Проверка». Каждый из них предоставит нам различные типы информации, относящейся к нашей видеокарте, как мы увидим ниже.

Математика, делающая всё лучше

Тензорные вычисления чрезвычайно полезны в физике и проектировании, они используются для решения всевозможных сложных задач в механике жидкостей, электромагнетизме и астрофизике, однако компьютеры, которые использовались для обработки подобных чисел, обычно выполняли операции с матрицами в больших кластерах из центральных процессоров.

Ещё одна область, в которой любят применять тензоры — это машинное обучение, особенно её подраздел «глубокое обучение». Его смысл сводится к обработке огромных наборов данных в гигантских массивах, называемых нейронными сетями. Соединениям между различными значениями данных задаётся определённый вес — число, выражающее важность конкретного соединения.

Поэтому когда нам нужно разобраться, как взаимодействуют все эти сотни, если не тысячи соединений, нужно умножить каждый элемент данных в сети на все возможные веса соединений. Другими словами, перемножить две матрицы, а это классическая тензорная математика!

Чипы Google TPU 3.0, закрытые системой водяного охлаждения

Именно поэтому во всех суперкомпьютерах глубокого обучения используются GPU, и почти всегда это Nvidia. Однако некоторые компании даже разработали собственные процессоры из тензорных ядер. Google, например, в 2016 году объявила о разработке своего первого TPU (tensor processing unit), но эти чипы настолько специализированные, что не могут выполнять ничего, кроме операций с матрицами.

Чем TDP отличается от TGP?

TDP происходит от английской аббревиатуры Thermal Design Power (также известной как Thermal Design Point и Thermal Design Parameter) и относится к количеству тепла, которое теплоотвод графической карты должен уметь рассеивать на основе тепла, генерируемого графическим процессором. Например, 100 Вт TDP означает, что графический приемник должен быть спроектирован таким образом, чтобы рассеивать такое количество тепла, и не отражает потребление графическим процессором.

Однако теперь и AMD, и NVIDIA используют его вопреки тому, что происходит в радиаторах процессора, чтобы выразить потребление только графическим процессором.

В итоге, вот условия, которые мы можем найти:

TDP: Расчетная тепловая мощность, количество тепла, которое теплоотвод должен уметь рассеивать. В графике они используют его для выражения потребления только графического процессора, а не графики в целом.
ТГП: Total Graphics Power, общее энергопотребление видеокарты.
ТВР: Общая мощность платы, эквивалентная предыдущей.
ГПК: Видеокарта Power, эквивалентная предыдущим.
ПДК: Максимальная потребляемая мощность В некоторых случаях мы можем видеть этот термин, и он относится к пиковой мощности, которую он потребляет максимум.

В общем, NVIDIA продолжает неохотно им пользоваться. Например, в Техническом документе графики архитектуры Тьюринга он продолжает выражать его в TDP, но затем указывает, что это относится только к потреблению графического процессора.

Итак, теперь, когда вы смотрите на спецификации видеокарты, вы должны знать, что TDP относится только к потреблению графического процессора, а если они указывают на TGP, то это общее потребление графики.

Одним из важнейших компонентов нашего компьютера является видеокарта. Элемент, на который мы иногда готовы потратить много денег, поэтому никогда не помешает иметь низкий уровень, чтобы контролировать, контролировать его температуру, чтобы избежать перегрева или падения производительности. Чтобы помочь нам в этой работе, мы можем использовать интересное и бесплатное приложение, такое как GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР-З, о котором мы и поговорим сегодня.

GPU-Z - это программное обеспечение, разработанное TechPowerUp это поможет нам предоставить нам важную информацию о нашей видеокарте, совместимой с тремя крупными производителями на данный момент, такими как NVIDIA, AMD и Intel . С помощью этого точного инструмента мониторинга мы сможем узнать все внутренние характеристики нашей видеокарты, показывая нам обширную и полную информацию, выходящую далеко за рамки модели и ее памяти.

Это приложение поддерживает создание файлов журнала и может быть очень полезным для всех тех пользователей, которые хотят обновить свое оборудование, чтобы купить видеоигру с высокими требованиями к графике или просто сравнить конфигурацию нашей видеокарты с конфигурацией других систем.

Поддерживает графические устройства NVIDIA, AMD, ATI и Intel
Отображает информацию об адаптере, графическом процессоре и дисплее
Отображает разгон, частоту по умолчанию и частоту 3D (если доступно)
Включает нагрузочный тест графического процессора для проверки конфигурации линии PCI-Express
Проверка результатов
GPU-Z может создать резервную копию BIOS вашей видеокарты
Установка не требуется, доступен дополнительный установщик
Поддержка Windows XP / Vista / Windows 7 / Windows 8 / Windows 10 (поддерживаются 32-битные и 64-битные версии)

Альтернативные варианты для GPU-Z

Если мы ищем программу для мониторинга видеокарты, мы предлагаем несколько альтернатив GPU-Z, которые мы можем принять во внимание:

Что такое TGP видеокарты?

TGP является аббревиатурой на английском языке для ” Общая графическая мощность «, Или« общее потребление графики », если перевести это на испанский язык. Фактически, это потребляемая мощность. GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР видеокарты, и она пришла на смену способу, которым мы определяли до сих пор TDP. Его еще называют ТБФ для «Общая мощность платы» или «Типичная мощность платы» в случае графики AMD, и определяет общее потребление графики включая GPU, память, VRM и т. д.

Поэтому, когда мы смотрим, какой источник питания является наиболее подходящим для нашей системы с учетом графической карты, параметр, который мы должны принять во внимание, - это TGP, а не TDP, поскольку именно он сообщит нам общий расход устройства. И, как мы говорили, сейчас оба производителя уже указывают это в своих технических характеристиках, даже в профессиональном ассортименте.

Графический процессор не подходит для перекодирования

У графических карт в течение многих лет были устройства, кодирующие видео, их задача - брать последние последовательные кадры приложения и создавать с ними видео в определенном формате, а затем сохранять его или передавать по сети. Кодирование сделано потому, что если бы у нас был файл с исходной информацией, он потребовал бы большого количества данных и очень высокой скорости загрузки.

Но аппаратный видеокодек внутри GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР не имеет скорости, чтобы иметь возможность передавать с разными разрешениями и в реальном времени, если вы посмотрите на это, у подавляющего большинства людей, которые стримят, время задержки составляет несколько секунд и, следовательно, сотни кадров.

Таким образом, графические процессоры, будь то выделенные или интегрированные, недостаточно хороши для передачи контента в реальном времени, и необходимо использовать специализированное оборудование, которое есть не у всех, именно в этот момент они выходят на сцену. VPU как выделенный процессор для обработки видео.

Необходимость обрабатывать больший объем данных, чем кодеки, входящие в стандартную комплектацию SoC и графических процессоров, делает VPU эквивалентом выделенной видеокарты по сравнению с простыми интегрированными аппаратными кодеками, поэтому процессоры просто создаются специализированными, которые мы называем VPU.

Бесплатная загрузка GPU-Z

Если мы хотим использовать GPU-Z для мониторинга нашей видеокарты, мы можем использовать его для бесплатные для домашнего и коммерческого использования, которые мы можем скачать с его веб-сайт Честного ЗНАКа . Также предлагается GPU-Z DDK, который предоставляет нам простую в использовании DLL с полным набором функций. Он совместим с Windows, от его версии XP до Windows 10, в 32-бит и 64-бит версий.

Доступна последняя версия v2.38.0 соответствующий 12 марта 202 1, который демонстрирует отличную поддержку и политику обновлений со стороны разработчиков, поддерживает приложение в актуальном состоянии с исправлениями ошибок и улучшениями в его различных разделах.

FurMark

Эта программа была разработана для определения состояния нашей видеокарты. Для этого он отвечает за выполнение различных тестов, чтобы проверить, все ли работает правильно или есть проблемы. Он также имеет графический монитор температуры для оптимизации охлаждения корпуса. Мы можем бесплатно скачать FurMark с здесь.

report this ad

Мы привыкли, что воспроизведение видео и даже его кодирование выполняется небольшими сопроцессорами в SoC и GPU, которые отвечают за эту задачу. Концепция Видео Процессорный блок или VPU выходит за рамки этого. Тип процессора, предназначенный для крупномасштабной обработки видео.

Бизнес потокового контента, созданного пользователями, существует с нами более десяти лет, равно как и трансляция сериалов и фильмов через Интернет. За всем этим стоит специализированное оборудование, которое все чаще находится в процессе разработки, а именно VPU, что означает возврат к специализированному видеооборудованию.

Где расположены VPU?

В общем, VPU - это не тип оборудования, которое обычно входит в стандартную комплектацию большинства компьютеров, поскольку очень немногие люди нуждаются в оборудовании для обработки видео с таким уровнем мощности для повседневного использования.

На серверах платформ потокового видео независимо от типа контента, который через них передается пользователям.
В специализированном оборудовании, используемом для перекодирования, это, как правило, видеоплееры с рядом видеовходов и выходов. Некоторые старые телевизионные сети используют этот тип оборудования для прямой трансляции своего старого и аналогового контента в цифровой формат.
В системах видеоконференцсвязи, где появление удаленной работы привело к необходимости иметь возможность осуществлять четкую и плавную связь между различными сторонами.
В системах компьютерного зрения, чтобы система имела глаза и могла «видеть» то, что находится вокруг, не только в роботах или умных автомобилях, но также в смартфонах и планшетах.

Таким образом, VPU всегда будут видны, когда требуется гораздо более высокая обработка видео, чем у обычного ПК, и постепенно они проникают на разные рынки, учитывая важность получения потокового видео для нескольких разных клиентов, которые проигрывают. разные условия.

В течение последних трёх лет Nvidia создавала графические чипы, в которых помимо обычных ядер, используемых для шейдеров, устанавливались дополнительные. Эти ядра, называемые тензорными, уже есть в тысячах настольных PC, ноутбуков, рабочих станций и дата-центров по всему миру. Но что же они делают и для чего применяются? Нужны ли они вообще в графических картах?

Сегодня мы объясним, что такое тензор, и как тензорные ядра используются в мире графики и глубокого обучения.

Кодирование, декодирование и перекодирование

Одним из наиболее важных элементов является передача видео в реальном времени, а это означает, что между передачей события и его приемом должно быть минимально возможное время. Другими словами, должна быть полностью плавная повторная передача, а это требует большой вычислительной мощности, поскольку скорость обработки, которая нам нужна, намного выше, поскольку она требует кодирования за гораздо меньшее время.

К этому усложнению следует добавить огромное количество устройств, подключенных к сети, которым будет требоваться контент с разным разрешением и в разных форматах. Это то, с чем аналоговому телевидению вообще не приходилось иметь дело, поскольку все телевизоры работали с одним и тем же разрешением независимо от их размера, поэтому не было необходимости генерировать множество разных разрешений.

С точки зрения воспроизведения все проще, поскольку им нужно только обрабатывать видеосигнал с определенной скоростью передачи данных, форматом файла и определенным разрешением. К этому мы должны добавить, что большинство ПК, которые есть у людей дома, уже оборудованы для одновременного воспроизведения нескольких видеопотоков, но кодирование - это другая проблема, которая намного сложнее, когда дело доходит до его реализации и с точки зрения ваши вычислительные затраты.

Дополнительно

В этом разделе «Дополнительно» мы можем увидеть гораздо более важную информацию, как из нашего графика, так и из из самые популярные API и подробная информация о различных его компонентах. При первом доступе мы по умолчанию увидим, как появляется вкладка «Общие», где мы найдем информацию, относящуюся к последней версии нашего драйвера. Если мы щелкнем по нему, откроется раскрывающееся меню с вкладками NVIDIA или AMD BIOS, WDDM, DXVA, DirectX 9, DirectX 10, DirectX 11, DirectX 12, OpenCL, CUDA и Vulkan.

Архитектура ВПУ

VPU, как и графический процессор, является сопроцессором для основного ЦП, поэтому его задача - освободить ЦП для выполнения определенной работы и сделать ее в лучших условиях и за меньшее время, чем сам ЦП.

У вас могут быть шейдерные блоки, но в них отсутствует блок текстур и другие элементы для графики, такие как блок вычислений для пересечения лучей в сцене, который используется в трассировке лучей.
Он также не имеет специализированных модулей для графики за пределами модулей шейдера, таких как модули тесселяции, модули растеризации и выходные данные рендеринга.
Они имеют большое количество аппаратных видеокодеков с возможностью одновременной обработки нескольких видеопотоков. Эти кодеки занимают значительную часть чипа по сравнению с тем, что они занимают в обычном графическом процессоре.
Некоторые устройства используют оборудование искусственного интеллекта для выполнения таких алгоритмов, как изменение разрешения кадра, стиля, интерполяции и экстраполяции.

По сравнению с графическим процессором его возможности по преобразованию данных из одного формата в другой и из одного разрешения в другое намного выше с точки зрения скорости. Таким образом, его кодеры намного мощнее, отчасти потому, что они обеспечивают высокую скорость кодирования, декодирования и транскодирования не только благодаря аппаратным кодекам, но и вычислительной мощности окружающих их устройств.

Проверка

В GPU-Z также есть вкладка «Проверка», которую мы можем использовать для загрузки захваченных данных на веб-сайт TechPowerUP. Это то, что мы можем использовать, чтобы запросить помощь у разработчика программы в случае, если она нам понадобится, или поделиться какими-либо проблемами, которые мы, возможно, обнаружили, которые могут помочь нам их решить. Более продвинутые пользователи могут использовать его, чтобы показать всю производительность, которую может достичь их видеокарта, подтверждая с помощью предоставленного захвата, что указанные данные реальны.

Многообещающее начало

Итак, ситуация такова — тензорные ядра, отличные аппаратные блоки, которые, однако, встречаются только в некоторых картах потребительского уровня. Изменится ли что-то в будущем? Так как Nvidia уже значительно улучшила производительность каждого тензорного ядра в своей архитектуре Ampere, есть большая вероятность того, что они будут устанавливаться и в модели нижнего и среднего ценового уровня.

Хотя таких ядер пока нет в GPU компаний AMD и Intel, возможно, в будущем мы их увидим. У AMD есть система повышения резкости или улучшения деталей в готовых кадрах ценой небольшого снижения производительности, поэтому компания, возможно, будет придерживаться этой системы, особенно учитывая то, что её не нужно интегрировать разработчикам, достаточно включить её в драйверах.

Существует также мнение, что пространство на кристаллах в графических чипах лучше было бы потратить на дополнительные шейдерные ядра — так поступила Nvidia при создании бюджетных версий своих чипов Turing. В таких продуктах, как GeForce GTX 1650, компания полностью отказалась от тензорных ядер и заменила их дополнительными FP16-шейдерами.

Но пока, если вы хотите обеспечить сверхбыструю обработку GEMM и воспользоваться всеми её преимуществами, то у вас есть два варианта: купить кучу огромных многоядерных CPU или просто один GPU с тензорными ядрами.

Это опция есть только на видюшках от АТИ Радион.
Иногда играя в ГТА СА она вылетает на рабочий стол и появляеца какая-то бодяга.
Типа ВПУ Рековер че-то там восстановил.
А если я этот ВПУ Рекувер вырублю то игра просто виснет и все тут.
А так приходица дальше играть с частотой обновления монитора 60 Гц.
Вобщем ХЕЛП.
Че это такое?

ЗЫ
Это функция драйверов.
А по сему вопрос по железу.
Наверное.

Совет:
Сменить охлаждение на GPU видеокарты и отключить оту VPU recover на х@р.
Ну или попробуй понизить чатоты GPU.
Ну или хоть крышку открой у системника.

А где частоты ГПУ можно понизить?
Охлаждение на видюхе смениить не магу ибо она ешо на гарантии.
тригода это вам не шутка.
А устанавливать охлаждение не снимая видюхи. я вам че Коперфильд?
или вы меня за хирурга-практолога держите?
Думаете у меня руки оттуда откуда надо растут.

PS
Извините вспылил.

Ну а чего вы тогда хотели услышать?
Три года - не смеши - забей. Я забиваю уже через три дня после покупки какой-нибудь комплектухи.
А проц если сразу не сгорел, то и потом не сгорит, если только ты ему не поможешь.
Если сразу не спалилась - то потом все зависит только от кривизны рук.
Да и если корпус не апломбирован, то можно ковырять хоть до усрачки.
А охлаждение сменить - не значит потерять гарантию. А просто надо быть аккуратным, когда все спалишь, и по быстрому нацепить старую охладуху на спаленную бедняжку и бегом в сервисный центр с невинными глазками.
--------------------------
Че даже крышку стремно открывать?
В биосе попробуй отключить Agp FastWrite вроде так называется. Может поможет.
Пользуй модифицированные драйвера.

Краткий урок математики

Чтобы понять, чем же заняты тензорные ядра и для чего их можно использовать, нам сначала разобраться, что такое тензоры. Все микропроцессоры, какую бы задачу они ни выполняли, производят математические операции над числами (сложение, умножение и т.д.).

Иногда эти числа необходимо группировать, потому что они обладают определённым значением друг для друга. Например, когда чип обрабатывает данные для рендеринга графики, он может иметь дело с отдельными целочисленными значениями (допустим, +2 или +115) в качестве коэффициента масштабирования или с группой чисел с плавающей точкой (+0.1, -0.5, +0.6) в качестве координат точки в 3D-пространстве. Во втором случае для позиции точки требуются все три элемента данных.

Тензор — это математический объект, описывающий соотношения между другими математическими объектами, связанными друг с другом. Обычно они отображаются в виде массива чисел, размерность которого показана ниже.

Простейший тип тензора имеет нулевую размерность и состоит из единственного значения; иначе он называется скалярной величиной. При увеличении количества размерностей мы сталкиваемся с другими распространёнными математическими структурами:

1 измерение = вектор
2 измерения = матрица

Одна из самых важных математических операций, выполняемых над матрицами — это умножение (или произведение). Давайте взглянем на то, как перемножаются друг на друга две матрицы, имеющие по четыре строки и столбца данных:

Окончательным результатом умножения всегда будет то же количество строк, что и в первой матрице, и то же количество столбцов, что и во второй. Как же перемножить эти два массива? Вот так:

На пальцах это посчитать не удастся

Как вы видите, вычисление «простого» произведения матриц состоит из целой кучи небольших умножений и сложений. Так как любой современный центральных процессор может выполнять обе эти операции, простейшие тензоры способен выполнять каждый настольный компьютер, ноутбук или планшет.

Однако показанный выше пример содержит 64 умножений и 48 сложений; каждое небольшое произведение даёт значение, которое нужно где то хранить, прежде чем его можно будет сложить с другими тремя небольшими произведениями, чтобы позже можно было сохранить окончательное значение тензора. Поэтому, несмотря на математическую простоту умножений матриц, они затратны вычислительно — необходимо использовать множество регистров, а кэш должен уметь справляться с кучей операций считывания и записи.

Архитектура Intel Sandy Bridge, в которой впервые появились расширения AVX

На протяжении многих лет в процессорах AMD и Intel появлялись различные расширения (MMX, SSE, а теперь и AVX — все они являются SIMD, single instruction multiple data), позволяющие процессору одновременно обрабатывать множество чисел с плавающей запятой; это как раз то, что требуется для перемножения матриц.

Но существует особый тип процессоров, который специально спроектирован для обработки операций SIMD: графические процессоры (graphics processing unit, GPU).

Читайте также: