Сколько максимум ядер в процессоре
AMD представила следующее поколение серверных процессоров Epyc Rome, построенных на архитектуре Zen 2, с числом ядер от 8 до 64. По словам представителей компании, новые чипы быстрее, «холоднее» и дешевле продукции Intel того же класса.
Новые процессоры и партнеры AMD
AMD официально представила процессоры для центров обработки данных Epyc Rome, выполненные на базе микроархитектуре Zen 2. Это первые в мире серверные процессоры с архитектурой x86, производящиеся по семинанометровому технологическому процессу. Применение новой архитектуры позволило добиться 15-процентного прироста числа инструкций, повышенной производительности и энергоэффективности.
Новые процессоры должны составить конкуренцию чипам Intel Xeon Scalable второго поколения (семейство Cascade Lake). В AMD утверждают, что Epyc Rome обеспечивают вдвое большую производительность в сравнении с Xeon, при этом они могут быть от двух до четырех раз дешевле решений Intel при сравнимой вычислительной мощи.
AMD также заявила, о том, что ей удалось привлечь Google и Twitter в качестве клиентов. Сервис микроблогов планирует внедрить новинки в собственных дата-центрах в этом году. Поисковый гигант уже использует процессоры во внутренних ЦОДах. Кроме американских интернет-гигантов в числе партнеров AMD, уже анонсировавших свои планы по использованию решений чипмейкера, значатся Microsoft, HPE, Cray, Lenovo и Dell.
К 2020 г. AMD намерена довести свою долю на рынке серверных процессоров до 10%. Сейчас она не превышает 3%.
Характеристики чипов
Все чипы Epyc Rome поддерживают технологию многопоточности SMT (по два потока на ядро), могут работать с памятью DDR4-3200 в восьмиканальном режиме (до 4 ТБ), а также оснащены контроллером интерфейса PCI-E 4.0 на 128 линий.
Модель | Число ядер / потоков | Базовая тактовая частота (ГГц) | Максимальная тактовая частота (ГГц) | L3-кэш (МБ) | TDP (Вт) | Рекомендованная цена (доллары США) |
---|---|---|---|---|---|---|
AMD Epyc 7742 | 64 / 128 | 2,25 | 3,4 | 256 | 225 | 6 950 |
AMD Epyc 7702 | 64 / 128 | 2 | 3,35 | 256 | 200 | 6 450 |
AMD Epyc 7702P | 64 / 128 | 2 | 3,35 | 256 | 200 | 4 425 |
AMD Epyc 7642 | 48 / 96 | 2,3 | 3,3 | 256 | 225 | 4 775 |
AMD Epyc 7552 | 48 / 96 | 2,2 | 3,3 | 192 | 200 | 4 025 |
AMD Epyc 7542 | 48 / 96 | 2,9 | 3,4 | 128 | 225 | 3 400 |
AMD Epyc 7502 | 32 / 64 | 2,5 | 3,35 | 128 | 180 | 2 600 |
AMD Epyc 7502P | 32 / 64 | 2,5 | 3,35 | 128 | 180 | 2 300 |
AMD Epyc 7442 | 32 / 64 | 2,35 | 3,35 | 128 | 155 | 2 025 |
AMD Epyc 7402 | 24 / 48 | 2,8 | 3,35 | 128 | 180 | 1 783 |
AMD Epyc 7402P | 24 / 48 | 2,8 | 3,35 | 128 | 180 | 1 250 |
AMD Epyc 7352 | 24 / 48 | 2,3 | 3,2 | 128 | 155 | 1 350 |
AMD Epyc 7302 | 16 / 32 | 3 | 3,3 | 128 | 155 | 978 |
AMD Epyc 7302P | 16 / 32 | 3 | 3,3 | 128 | 155 | 825 |
AMD Epyc 7282 | 16 / 32 | 2,8 | 3,2 | 64 | 120 | 650 |
AMD Epyc 7272 | 12 / 24 | 2,9 | 3,2 | 64 | 120 | 625 |
AMD Epyc 7262 | 8 /16 | 3,2 | 3,4 | 128 | 155 | 575 |
AMD Epyc 7252 | 8 /16 | 3,1 | 3,2 | 64 | 120 | 475 |
AMD Epyc 7252P | 8 / 16 | 3,1 | 3,2 | 32 | 120 | 450 |
Размер кэш-памяти третьего уровня составляет от 32 до 256 МБ, штатный TDP варьируется от 120 до 225 Вт в зависимости от числа ядер и тактовой частоты.
Модуль «Управление уязвимостями» на платформе Security Vision: как выявить и устранить уязвимости в своей ИТ-инфраструктуре
Большая часть представителей линейки отличается поддержкой двухсокетных конфигураций, однако некоторые модели (с суффиксом “P” в названии) предназначены для работы «в одиночку».
Важно также отметить, что точно так же, как AMD Epyc первого поколения (Naples), представленные в мае 2017 г., процессоры Epyc Rome предназначены для установки в разъем Socket SP3, что даст возможность клиентам перейти с Naples на Rome без замены материнской платы.
Самый «бюджетный» из новых чипов – AMD Epyc 7252. Его рекомендованная цена составляет $475 (или $450 за версию, не поддерживающую двухпроцессорные конфигурации). Чип характеризуется таковой частотой 3,1-3,2 ГГц при весьма скромном TDP 120 Вт. Размер кэша составляет 64 МБ.
Флагман линейки – 64-ядерный AMD Epyc 7742 стоимостью $6,95 тыс. Он работает на частотах от 2,25 ГГц до 3,4 ГГц в турборежиме, может похвастаться 256 МБ кэш-памяти третьего уровня и стандартным показателем TDP в 225 Вт.
Data Fusion Awards: синергия разнородных данных становится неотъемлемой частью бизнеса, науки и государства
Напомним, что корпорация Intel в июле 2019 г. выпустила серверный процессор Xeon Platinum 8284 семейства Cascade Lake-SP стоимостью $15,5 тыс.
Пока AMD готовит 96-ядерные Threadripper 7000, компания Intel тоже не сидит сложа руки.
В Сети появились новые подробности о процессорах Sapphire Rapids-X. Как раньше уже говорилось, такие CPU должны выйти как в виде потребительской линейки HEDT, так и в виде решений для рабочих станций. Все процессоры будут носить имя Xeon-W и относиться к платформе Fishhawk Falls.
У AMD, напомним, ещё с прошлого поколения Threaripper также есть разделение на потребительские HEDT и модели для рабочих станций, которые выходят в рамках линейки Threadripper Pro. Правда, текущее поколение пока только в виде таких процессоров и доступно.
Как бы там ни было, если у AMD между двумя линейками разница есть, она ощутима, но не огромна, то у Intel это будут совершенно разные CPU как минимум по количеству ядер. Источник говорит, что потребительские ограничатся всего 24 ядрами, то есть вряд ли смогут конкурировать даже с Threadripper 3000, несмотря на более современную архитектуру. А вот топовые Xeon-W для рабочих станций будут иметь 56 ядер, что согласуется со всеми ранними данными. То есть до Threadripper 7000 им будет далеко.
Потребительские Xeon-W якобы будут работать на частоте до 5-5,2 ГГц при TDP в пределах 200-300 Вт. Такие процессоры будут иметь четырёхканальный контроллер ОЗУ и 64 линии PCIe 5.0.
Старшие Xeon-W предложат уже восьмиканальный контроллер памяти и 112 линий PCIe 5.0. Все новинки будут использовать сокет LGA 4677. Анонсировать новинки Intel может уже 27 мая, а на рынок они могут выйти в третьем квартале.
За последние пару лет сразу несколько компаний объявили о многоядерных процессорах, создаваемых этими организациями для высоконагруженных систем. О некоторых таких проектах на Хабре писали, в том числе и мы, о других — нет.
Сейчас мы решили собрать вместе информацию о чипах с десятками и сотнями ядер, чтобы эти данные были в одном месте. В подборке — только информация о чипах, которые либо уже выпущены, либо близки к началу производства. Есть и другие проекты, но некоторые из них пока под большим вопросом — о них известно лишь со слов глав компаний, никто их не видел, не трогал и не тестировал.
Еще больше? 850 тысяч ядер от Cerebras
Компания Cerebras представила WSE-2, 7-нм процессор с 850 тысячами ядер и энергопотреблением в 15 кВт. Площадь процессора равна площади кремниевой пластины. Количество транзисторов на ней составляет 2,6 трлн. Процессор предназначен для дата-центров, задач по обработке вычислений в области машинного обучения и искусственного интеллекта (AI).
И это не концепт, а рабочая система. Высокой производительности компания добивается благодаря сшиванию штампов на кремниевой пластине посредством коммуникационной сети. Общая пропускная способность в итоге повышается до 220 Пб/с. Частота ядер — от 2,5-3 ГГц.
Для работы с таким чипом нужна особая система. И разработчики создалии ее, назвав проект 15U. По словам авторов проекта, система на базе этого чипа позволяет обучать ИИ d 100-1000 раз быстрее любых других проектов.
Сейчас Cerebras представила облачную платформу Cerebras Cloud @ Cirrascale, которая предоставляет доступ к Cerebras CS-2 Wafer-Scale Engine (WSE) через облачный сервис Cirrascale.
«Набор инструментов компилятора предлагается с облачным набором инструментов, разработанным Cirrascale, — сказал генеральный директор Эндрю Фельдман (Andrew Feldman). — Итак, войдя в систему, вы получите доступ к вычислительному кластеру, хранилищу, CS-2; вы запустите свой стек компиляции и будете выполнять работу. Также вы получите контрольную точку и сохраните её в инфраструктуре Cirrascale, она будет идентифицирована, чтобы вы могли вернуться к выполнению этой работы позже. Все это интегрировано».
Понятно, что все это очень недешево — по словам представителей компании, сервис обойдется в $60 000 в неделю, $180 000 в месяц или $1 650 000 в год. За эти деньги пользователи получают доступ сразу ко всем ресурсам системы. Ее можно и купить, точная сумма неизвестна, но компания упоминала о нескольких миллионах долларов.
Наверняка вы подумали, что это какой-то очередной кликбейт. Что это за самый большой процессор в мире? Похоже сейчас нам будут рассказывать о процессоре, который на 5 процентов больше других, и то если рассматривать этот процессор только с определенной стороны. И да, просмотры и прочтения мы хотим собрать, но…
Сегодня мы расскажем вам о процессоре компании Церебро под названием Cerebras CS-1. И он действительно огромный!
Например, GPU, который считался самым большим раньше — это процессор Nvidia V100, а вот новый процессор Церебро. Он почти в 57 раз больше! Площадь самого чипа — 462 квадратных сантиметра — это почти столько же сколько площадь всей Nvidia 3090, вместе с системой охлаждения и разъемами.
А что вы скажете на то, что этот монстр способен симулировать некоторые физические модели быстрее самих законов физики? Заинтриговали? Что ж, тогда присаживайтесь, наливайте чаек. Сегодня будет разбор по-настоящему огромного однокристального процессора!
Итак, что же это за монстр такой и зачем он нужен? Давайте сразу ответим на второй вопрос — этот процессор создан для машинного обучения и искусственного интеллекта. Кроме того, он сильно расширит возможности для различного сложного моделирования и сможет заглядывать в будущее. Вообще, искусственный интеллект — это невероятно интересная и актуальная тема, а ее главные ограничения — это слабые вычислительные мощности. А если хотите узнать о реальных проектах с использованием искусственного интеллекта — у Илона Маска есть такой в запасе — Open AI.
Если вы думали, что закон Мура со своим увеличением количества транзисторов в процессоре каждые 1,5 года — это быстро, то посмотрите на потребности в области ИИ, ведь спрос на эти вычисления удваивается каждые 3,5 месяца!
Классический подход — это напихать кучу процессоров в серверные стойки, к каждому подвести систему охлаждения и питания, при этом каждый отдельный процессор еще надо связать друг с другом, а это, кстати, неизбежно вызывает задержки.
Скажем так — если вы возьмете двигатель от Ferrari и запихнете ее в старые Жигули, то машина конечно поедет быстрее, но как Ferrari все равно не поедет. Поэтому тут нужен принципиально иной подход, ведь для того, чтобы получить настоящий гиперкар надо взять хорошие тормоза, подвеску, рассчитать аэродинамику: с компьютерами точно также.
Компания Церебро это и сделала — они решили разработать свою систему с нуля, то есть вообще все — от архитектуры самих процессоров, до системы охлаждения и питания.
Это огромная машина, потребляющая 20 килоВатт, и занимающая треть стандартной серверной стойки, то есть можно размещать по три таких компьютера в одной стойке! А сам чип, по своей сути и предназначению, напоминает серверные GPU от NVIDIA, так что давайте их и сравним. Возьмем Nvidia Tesla V100.
Цифр много, приготовьтесь! Кроме размеров самого кристалла, процессор Церебро обладает четырьмя сотнями тысяч ядер, что в 78 раз больше, чем число ядер на NVIDIA Tesla V100! Количество транзисторов взрывает мозг — 1,2 триллиона, против 21 миллиарда у NVIDIA.
А сколько там памяти? 18 гигабайт l2 cache memory прямо на чипе! Это в три тысячи раз больше, чем у V100. Кстати у 3090 от той же NVIDIA, памяти на чипе тоже 6 мегабайт, прямо как у V100. Ну а про ширину полосы пропускания даже говорить страшно — у V100 это 300 Гигабит в секунду, а у Церебро — 100 ПЕТАбит в секунду. То есть разница в 33 тысячи раз!
А чтобы достичь схожей вычислительной мощности они заявляют, что нужна тысяча карт NVIDIA V100, что суммарно будет потреблять в 50 раз больше мощности и занимать в 40 раз больше места — это очень значительная экономия электроэнергии и свободного пространства.
Это конечно прекрасно — цифры поражают. Но как удалось их достичь?
Суть в размере. Чип — большой, нет, даже огромный. Именно это позволяет разместить столько всего на одном кристалле. И главное, что связь между элементами мгновенная, потому что не нужно заниматься сбором данных с разных чипов.
Однако, размер — это одновременно и главный недостаток Церебро.
Давайте по-порядку. Первое и главное — нагрев. Разработчики этого монстра прекрасно понимали, что они создают и какая система охлаждения нужна, поэтому она, как и сам процессор, были разработаны с нуля. Она представляет из себя комбинацию жидкостного охлаждения, которое направляется к охлаждаемым медным блокам! Охлаждающая жидкость, проходя через мощный насос, попадает в радиатор, где с помощью вентилятора происходит ее охлаждение, а горячий воздух уже выдувается наружу четырьмя дополнительными вентиляторами.
При потреблении 20 кВт, которые подаются через двенадцать разъемов питания, четыре уходит только на питание вентиляторов и насосов для системы охлаждения. Но в результате они достигли того, что чип работает при вдвое меньших температурах, чем стандартные GPU, что в конце концов повышает надежность всей системы.
Ну и конечно отдельно хочется сказать, что инженеры создали систему так, что она позволяет быстро менять почти любой компонент, что очень круто, так как в случае поломки — это уменьшает время возможного простоя.
Сам же чип собирает TSMC по, вы не поверите, 16 нанометровому техпроцессу. И тут вы можете справедливо возмутится. Как же так? Все уже делают чипы на 5 нм, какой смысл делать на древних 16 нм?
Тут то и скрывается вторая проблема. При производстве классических чипов неизбежно бывает брак, который приводит к тому, что несколько чипов оказываются негодными и выкидываются или используются для других задач, и чем мельче техпроцесс, тем выше процент брака. Но когда у тебя вся кремниевая подложка — это один чип, то любая ошибка в производстве приводит к тому, что всю пластину можно выкидывать. А при условии, что одна пластина может изготавливаться несколько месяцев и стоит около миллиона долларов, что ж….
Суть в том, что ребята решили, как бы подстраховаться. Ведь 16 нм техпроцессу уже почти семь лет: детали и тонкости при его производстве отлично изучены. Так сказать — уменьшают риски! Но стоит сказать, что уже ведется разработка и тестирование такого чипа на 7 нм, но его выход конечно будет зависеть от спроса на первое поколение! И там цифры просто огромные, только посмотрите на таблицу.
И тут вы можете справедливо заметить, что мы пока что ни слова не сказали о результатах, которых можно достичь с помощью этого монстра. Тут сложно, так как информация, в основном, закрытая, однако какие-то детали все равно просачиваются в медийное пространство.
Национальная лаборатория энергетических технологий Министерства энергетики США заявила, что CS-1 — первая система, которая смоделировала работу более миллиона топливных ячеек быстрее, чем в режиме реального времени.
Это означает, что когда CS-1 используется для моделирования, например, электростанции на основе данных о ее текущем состоянии, она может сказать, что произойдет в будущем быстрее, чем законы физики дадут такой же результат. Вы поняли? С помощью этого ПК можно заглянуть в будущее с высокой точностью, и если нужно подкорректировать и изменить его. И еще, например, в симуляции с 500 миллионами переменных Cerebras CS-1 уже обогнал суперкомпьютер Joule, занимающий 69-е место в рейтинге самых мощных суперкомпьютеров мира. Так что похоже со спросом проблем не ожидается.
Церебро планируется использовать для прогнозирования погоды или температуры внутри ядерного реактора или, например, проектирования крыльев самолета. Несомненно, лаборатории и различные исследовательские центры по всему миру найдут для Церебро области применения. Как вы понимаете, компьютер будет дорогим, но точная цена неизвестна.
Из открытых источников мы нашли только что в 2020 году в суперкомпьютерном центре Питтсбурга было куплено 2 компьютера Cerebras CS-1 за 5 миллионов долларов. Но система делается только под заказ и под каждого конкретного клиента, так что цена может варьироваться.
Выводы
Это явно уникальная система. И такого раньше никто не делал! Большинство производителей считают, что гораздо выгоднее и эффективнее наштамповать кучу маленьких процессоров, так как вероятность брака или поломки сильно падает и каждая ошибка сильно дешевле. Разработчики Церебро же решили пойти рискованным путем и, судя по тому, что процессор Cerebras CS-2 уже тестируют, их путь успешен.
И если все что они заявили — сбудется, то нас ждет абсолютно новая эра серверных вычислений, невероятные возможности для создания компьютерных моделей, новые мощности искусственного интеллекта. Нет сомнений, что и гиганты рынка, такие как Nvidia, Intel, Google, посмотрев на удачный опыт Церебро займутся разработкой своих огромных однокристальных систем. А вы только представьте, что будет если совместить это с квантовыми вычислениями, о которых мы недавно делали разбор? Ух!
Будем следить за развитием технологий, и продолжим дальше делать для вас такие интересные обзорные материалы про самые современные достижения!
PS. Кстати, лайк если поняли пасхалку в Церебро — ведь решетка радиатора выполнена в форме специальной сетки, которая используется в компьютерном моделировании для расчетов. Отсылка к предназначению Церебро!
Современные процессоры AMD, благодаря техническим особенностям своего устройства, отличного от устройства процессоров INTEL способны вмещать в себя большее количество ядер. Подробнее об этом в статье.
реклама
Да, не ожидала компания INTEL, что вечно догоняющий ее мальчик по имени AMD превратится в матерого конкурента. И как же INTEL хорошо и беззаботно существовала все это время, не нужно было особо напрягать свои мозги, создавать что-то новое, можно мусолить эдак с десяток лет одну и ту же архитектуру процессоров, лишь каждый год, меняя их название, да еще меняя сокет. Но потеряв бдительность, INTEL и не заметила, как значительная часть рынка процессоров перешла к AMD.
Но речь в этой статье не об этом, а разнице в технической реализации продуктов, а именно процессоров этих компаний, и выяснение, какая из технических реализаций на сегодняшний день лучше.
Итак, почему и как, процессоры AMD на архитектуре ZEN, спасшие компанию AMD от вымирания способны вмещать в себя больше ядер, чем процессоры от INTEL.
реклама
Первой причиной этого является особенность компоновки процессоров построенных по архитектуре ZEN, а именно чиплетная компоновка.
Особенность, которой заключается в размещении всех функциональных узлов процессора не на одном монокристалле, а разделение этих узлов на отдельные, небольшие кристаллы.
реклама
Так вот, производство отдельных, относительно небольших кристаллов является более надежным и простым решением, с меньшим процентом выхода бракованных кристаллов, чем при производстве одного монокристалла вмещающего в себе все эти же функциональные узлы. Например, если при производстве комплекта кристаллов для процессора AMD с архитектурой ZEN, один окажется бракованным, то в мусор выбросится только он один, а остальные будут установлены в процессор. А если брак окажется в монокристалле, который компания INTEL применяет в своих процессорах, то в мусор улетит весь процессор.
Хотя мы, конечно же, все знаем, что в мусор ничего не улетит, а бракованные участки кристаллов производитель отключит аппаратным методом и установит их в младшие модели процессоров. Но это уже тема другой статьи.
По опыту производства кристаллов известно, что чем сложнее и больше кристалл, тем гораздо больше вероятность выхода его бракованным. Например, добавление каждого ядра в кристалл, который уже состоит из четырех ядер, при его производстве, будет увеличивать вероятность брака на 10% при увеличении количества на одно каждое ядро. Компания INTEL, как раз и использует в своих процессорах монокристаллы. И создание монокристалла более чем с 10-12 ядрами экономически неоправданно увеличивает процент выхода бракованных кристаллов.
реклама
А компания AMD тем временем, засовывает в свои процессоры чиплеты, набирая необходимое им количество ядер без ограничения.
Еще одной технологической особенностью устройства процессоров, ограничивающей максимальное количество используемых в них ядер, является внутренняя шина обмена данными. Она предназначена для обмена данными между ядрами, кэш памятью, контроллером памяти, графическим ядром, элементами северного моста.
У процессоров INTEL она называется кольцевой шиной (RINGBUS), состоящей из четырех линий: обмена данными, обмена запросами, мониторингом и подтверждением, и может располагаться только на одном монокристалле, она способна передавать за один такт 32 байта данных.
Одна такая кольцевая шина может полноценно обслуживать до 10 ядер. Например, в поколении процессоров Comet Lake применили уже две кольцевые шины, синхронизированные между собой двунаправленным коммутатором, что напрямую говорит о том, что одна кольцевая шина уже «задыхается» при работе с 10 производительными ядрами. Применение двух шин, а так же увеличение количества ядер выше 10, значительно повышает энергопотребление, как самих кольцевых шин, так и процессором в целом. Увеличивается соответственно и тепловыделение процессора. Поэтому кольцевая шина стала препятствием для дальнейшего увеличения количества ядер.
Сразу оговорюсь, что я в этой статье рассматриваю процессоры потребительской ниши, а не процессоры какого-нибудь специального (серверного) назначения. Да, и у INTEL есть модели процессоров, в которых применяется другая внутренняя шина связи, например ячеистая сеть (MESH), реализованная по другому принципу, которая может обслуживать гораздо больше 10 ядер, но и соответственна и цена будет соответствующая, и к потребительской нише их отнести нельзя.
В процессорах AMD c архитектурой ZEN внутренняя шина обмена данными называется: INFINITY FABRIC, в отличие от кольцевой шины процессоров INTEL она может соединять модули находящиеся в разных кристаллах, такое решение конечно снизило себестоимость производства, но и не обошлось и без накладных расходов, из-за длинных линий связи между отдельными кристаллами (чиплетами) несколько увеличились задержки в передаче данных между ними.
Шина Infinity Fabric представляет из себя коммутатор 256 разрядных двунаправленных шин, и как видно на примере процессора AMD Ryzen 9 5950X, без проблем справляется с обслуживанием 16 ядер, при этом, абсолютно не доходя до максимального предела своих возможностей. Кроме того она является универсальной, и в нее заложен хороший задел на будущее, в плане построения на ее базе разнообразных конфигураций процессоров AMD.
В свое время кольцевая шина (RINGBUS) компании INTEL, интегрированная еще в процессоры поколения Sandy Bridge тоже имела большой технический задел на будущее, и удовлетворяла все потребности процессоров последующих поколений, вплоть до поколения Comet Lake заимевшего на своем борту 10 ядер. К сожалению, на сегодняшний день кольцевая шина исчерпала заложенные ранее в нее возможности.
Компании INTEL теперь необходимы кардинально новые технические решения, чтобы вернуть свое лидерство на рынке процессоров.
Intel Xeon W-3300
Сначала разомнемся — вспомним чип от Intel. Это Xeon W-3300 для рабочих станций и серверов, который производится по 10 нм технологии, архитектура его ядра — Sunny Core. Количество ядер составляет от 12 до 38.
Чип вполне реален, его можно видеть вживую и даже купить. Правда, доступен такой процессор далеко не всем — его стоимость составляет $4500 за топовую модель.
Устанавливаются такие процессоры в материнские платы с разъёмом LGA4189 и чипсетом C21A.
Есть у Intel и другие чипы — линейка Xeon Scalable, количество ядер в которых достигает 40. Кстати, мы предлагаем на основе Intel® Xeon® Scalable 3-го поколения серверы — так что если такое оборудование нужно вашей компании, велкам.
Указанные процессоры предназначены для работы в системах машинного обучения, видеомонтажа и другим работам с видео, 3D-моделирования и т.п.
В 2019 году калифорнийская компания Ampere представила первый в отрасли 80-ядерный ARM-процессор, который получил название Ampere Altra. Он предназначен, в первую очередь, для работы в серверном оборудовании — в пользовательское устройство его установить не получится.
На днях компания ADLINK представила встраиваемый модуль COM-HPC на чипе Ampere Altra с 80 ядрами. Этот модуль может иметь максимум 768 ГБ оперативной памяти DDR4 c шестью каналами. Модуль предназначен для установки в системы автономного вождения, обработки изображений, обработки видео и т.п.
Что касается характеристик, то новинка оснащена 128 физическими ядрами (без технологии многопоточности). Кэш L1 для инструкций и данных — 64 Кбайт, L2 — 1 МБ, L3 — 32 МБ для каждого из ядер. Тактовая частота ядер — 3.0 ГГц.
Каждый процессор предоставляет до 625 Тфлопс, это примерно 2,5 Пфлопс на каждый сервер. Для обеспечения работы системы используется сервер-модуль собственной разработки компании. Достоинство чипов и систем Tachyum, по словам ее представителей, не только в мощных чипах и инфраструктуре, но и меньшем энергопотреблении и стоимости — не только самих систем, но и их эксплуатации.
В этом году компания все еще не представила полноценные чипы, но зато изготовила аппаратный эмулятор, который позволяет оценить эти чипы. Эмулятор разработан на базе ПЛИС, его системная плата базируется на четырех программируемых матрицах, которые имитируют работу сразу восьми ядер Prodigy. На базе этой системы компании удалось запустить Linux, доказав, таким образом, работоспособность своей системы.
Удвоенное число ядер
Линейка AMD Epyc второго поколения представлена 19 процессорами с 8, 16, 24, 32, 48 и 64 физическими ядрами. У предыдущего поколения процессоров AMD рекордным было 32 вычислительных ядра на чип. Intel, в свою очередь, выпускает 56-ядерные серверные чипы Xeon Cascade Lake AP.
Удвоенное число вычислительных ядер процессоров Epyc Rome стало возможно благодаря применению многокристальной компоновки под названием Chiplet Design, где восемь вычислительных модулей («чиплетов») по восемь вычислительных ядер и 16 вычислительных потоков каждый симметрично размещены по сторонам от модуля ввода/вывода с контроллерами и интерфейсами.
Для коммуникаций между вычислительными блоками с ядрами x86 и интерфейсным модулем служит высокоскоростная внутренняя шина Infinity Fabric. За счет того, модуль ввода/вывода производится с нормами 14 нм, его размеры получились непропорционально большими относительно вычислительных блоков, выполненных с соблюдением норм 7 нм.
Мало ядер? 512-ядерный чип от китайской компании
Ближе к концу лета китайская компания Ziguang заявила о создании процессора с 512 вычислительными ядрами. Он получил название H3C Engiant 800. Компания, о которой идет речь, является частью холдинга Tsinghua Unigroup. В него же входит Unisoc, разрабатывающая мобильные процессоры, и Yangtze Memory, которая создает чипы памяти.
Что касается чипа, то количество транзисторов в нем составляет около 40 млрд. При этом не совсем ясно, какая компания будет заниматься производством процессора. У разработчиков нет собственных фабрик, которые способны производить настолько необычные процессоры, поэтому, видимо, придется обращаться с сторонним компаниям. Чип выполнен по 7 нм техпроцессу.
Чип станет доступен уже с 2022 года. Но это речь о массовых заказах. Уже в этом году некоторые крупные клиенты получат тестовые образцы процессора, чтобы опробовать его в работе.
Читайте также: