Самое большое количество ядер в процессоре
Esperanto, основанная стоявшим у истоков чипмейкера Transmeta Дэйвом Дитцелем, представила процессор ET-SoC-1 с более чем 1 тыс. ядер RISC-V. Окрещенный создателями «суперкомпьютером на кристалле» чип, в первую очередь рассчитан на специфические нагрузки в области искусственного интеллекта и машинного обучения, но, как утверждают разработчики, справится и с любыми другими серверными задачами.
Большой и мощный
Американская компания Cerebras Systems совместно с TSMC выпустила самый большой и производительный в мире процессор. Об этом сообщило издание Tom’s Hardware. Новинка, получившая название Wafer Scale Engine 2 (WSE-2), является преемником чипа WSE, выпущенного компанией в 2019 г.
Размеры чипа составляют 220x220 мм – на производство одной такой микросхемы уходит целая 300-миллиметровая кремниевая пластина. На площади чипа размером 46255 мм 2 (примерно в 56 раз больше площади самого крупного графического процессора Nvidia A100) умещается 2,6 трлн транзисторов.
При одинаковых габаритах WSE-2 отличается от предшественника пониженным энергопотреблением, более чем удвоенным числом транзисторов и ядер. Все это стало возможным благодаря переходу с 16-нанометрового на более совершенный, 7-нанометровый техпроцесс.
Cerebras утверждает, что у нее уже есть рабочие системы на базе WSE-2, а на рынке процессор появится в III квартале 2021 г.
Несколько слов о RISC-V
Архитектура набора команд RISC-V с открытым исходным кодом имеет высокую привлекательность за счет отсутствия лицензионных платежей, традиционных при использовании большинства других процессорных архитектур, в том числе ARM.
Data Fusion Awards: синергия разнородных данных становится неотъемлемой частью бизнеса, науки и государства
Поддержка и развитие RISC-V осуществляется некоммерческой организацией RISC-V International, в которую входят более 1 тыс. членов в 50 странах. Процессоры RISC-V широко применяются в микроконтроллерах. Например, компания Western Digital ежегодно поставляет более 2 млрд контроллеров RISC-V в своих накопителях.
В июне 2021 г. CNews писал о том, что корпорация Intel заинтересована в покупке SiFive, производителя чипов на открытой архитектуре RISC-V, за $2 млрд.
Удвоенное число ядер
Линейка AMD Epyc второго поколения представлена 19 процессорами с 8, 16, 24, 32, 48 и 64 физическими ядрами. У предыдущего поколения процессоров AMD рекордным было 32 вычислительных ядра на чип. Intel, в свою очередь, выпускает 56-ядерные серверные чипы Xeon Cascade Lake AP.
Удвоенное число вычислительных ядер процессоров Epyc Rome стало возможно благодаря применению многокристальной компоновки под названием Chiplet Design, где восемь вычислительных модулей («чиплетов») по восемь вычислительных ядер и 16 вычислительных потоков каждый симметрично размещены по сторонам от модуля ввода/вывода с контроллерами и интерфейсами.
Для коммуникаций между вычислительными блоками с ядрами x86 и интерфейсным модулем служит высокоскоростная внутренняя шина Infinity Fabric. За счет того, модуль ввода/вывода производится с нормами 14 нм, его размеры получились непропорционально большими относительно вычислительных блоков, выполненных с соблюдением норм 7 нм.
Особенности чипа
Процессор содержит 850 тыс. программируемых ядер, оптимизированных для вычислений в векторном пространстве, а объем встроенной памяти SRAM достигает 40 ГБ. Ядра работают на частоте в диапазоне 2,5-3 ГГц – такой же, как и у чипа первого поколения. В WSE-2 пропускная способность памяти по сравнению с WSE увеличилась с 9 ПБ/сек до 20 ПБ/сек.
Благодаря усилению межкомпонентных соединений общая пропускная способность чипа выросла со 100 Пбит/сек до 220 Пбит/сек. В чипе предусмотрена возможность обхода дефектных областей. Это необходимо, поскольку при таком внушительном количестве ядер возникновение брака при штамповке на фабрике очень вероятно.
Созданием чипов для решения задач в области искусственного интеллекта занимается множество компаний по всему миру. В их числе как гиганты вроде Nvidia, Intel, Qualcomm и Google, так и небольшие стартапы, например, британская Graphcore или американская Sambanova Systems.
ИИ-системы опираются на параллельные вычисления, для которых требуются многопроцессорные системы. Их производительность во многом ограничивает низкая скорость межпроцессорных коммуникаций, в которых задействована оперативная память. Cerebras в своих чипах линейки WSE решает эту проблему с помощью размещения огромного объема памяти непосредственно на кристалле. В нее загружается сразу вся необходимая для проведения вычислений с использованием всех рабочих ядер информация. При этом нагрузка распределяется равномерно таким образом, чтобы обработка данных была завершена всеми ядрами одновременно.
Самый большой и мощный процессор в мире
Несмотря на внушительное количество ядер, разработка Esperanto по данному показателю уступает продукту американской Cerebras Systems.
Выпущенный в апреле 2021 г. ИИ-процессор Wafer Scale Engine 2 (WSE-2) содержит 850 тыс. программируемых ядер, оптимизированных для вычислений в векторном пространстве, а объем встроенной памяти SRAM достигает 40 ГБ. Ядра работают на частоте в диапазоне 2,5-3 ГГц. В WSE-2 пропускная способность памяти составляет 20 ПБ/сек. Размеры чипа составляют 220х220 мм.
Модуль «Управление уязвимостями» на платформе Security Vision: как выявить и устранить уязвимости в своей ИТ-инфраструктуре
Cerebras обещала вывести процессор на рынок в III квартале 2021 г. Выпускать его, как и ET-SoC-1, должна TMSC по 7-нанометрову техпроцессу.
Представлен гигантский процессор WSE-2 для машинного обучения и искусственного интеллекта. Новинка, производящаяся на мощностях TSMC по дизайну Cerebras, содержит 850 тыс. вычислительных ядер и 40 ГБ встроенной памяти, которые разместились на кристалле размером 220x220 мм.
Несколько фактов о Cerebras
Основанный в 2016 г. американский стартап Cerebras System, по данным ZDNet, за время своего существования привлек более 475$ млн. Сегодня в компании работают 330 сотрудников.
Побеждать в борьбе за клиентов Cerebras планирует в том числе и на маркетинговом фронте. Для этого компания наняла опытного Рупала Холленбека (Rupal Hollenbeck), бывшего директора по маркетингу в Oracle.
AMD представила следующее поколение серверных процессоров Epyc Rome, построенных на архитектуре Zen 2, с числом ядер от 8 до 64. По словам представителей компании, новые чипы быстрее, «холоднее» и дешевле продукции Intel того же класса.
Особенности чипа ET-SoC-1
На кристалле площадью 570 мм 2 (при размере упаковки 45х45 мм) создатели разместили 24 млрд транзисторов. Они, в частности, формируют два кластера ядер – ET-Minion и ET-Maxion – и один сервисный процессор. Чип насчитывает 1088 «малых» энергоэффективных кастомных ядер ET-Minion, которые спроектированы для работы в параллельном режиме. В дополнение к ним разработчиками предусмотрено четыре «больших» высокопроизводительных ядра ET-Maxion. Кластер «малых» ядер, используется при выполнении инструкций по порядку (in-order execution), «больших» – для внеочередного исполнения (out-of-order execution).
Каждое ядро ET-Minion снабжено собственным блоком векторных и тензорных операций, которые помогают в решении задач в сфере искусственного интеллекта (в частности, в работе рекомендательных систем, основанных на машинном обучении), а также поддерживают одновременную многопоточность (SMT, Simultaneous multithreading). Рабочая частота 64-битных RISC-V-ядер ET-Minion лежит в диапазоне 0,3-2 ГГц.
Универсальные ядра ET-Maxion «понимают» инструкции RISC-V RV64GC и могут работать независимо от массива «малых» ядер в диапазоне от 0,5–2 ГГц.
Помимо 1093 ядер RISC-V, чип Esperanto ET-SoC-1 несет 160 МБ памяти типа SRAM, объем которой распределен между кэшем первого и второго уровней, а также сверхоперативной (scratchpad) памятью. Заявлена поддержка интерфейса PCIe x8 Gen4, четырех каналов оперативной памяти LPDDR4x и безопасной загрузки.
«Суперкомпьютер на кристалле»
Американский стартап Esperanto выпустил универсальный процессор с более чем 1 тыс. ядер. Носящая название 64-разрядная микросхема ET-SoC-1 базируется на открытой архитектуре RISC-V, отличается сверхнизким энергопотреблением и предназначена для рабочих нагрузок в области параллельных вычислений. Разработчики называют свое детище не иначе как «суперкомпьютер на кристалле» и «самый высокопроизводительный коммерческий процессор RISC-V».
В Esperanto подчеркивают, что их «суперкомпьютер на чипе» подходит для любых видов рабочих нагрузок, а не только для ускорения ИИ благодаря наличию ядер общего назначения.
Уровень энергопотребление процессора, по заявлению разработчиков, в среднем составляет 20 Вт, но в зависимости от нагрузок может варьироваться от 10 до 60 Вт.
Esperanto ET-SoC-1 выпускается на базе мощностей тайваньской TSMC с использованием 7-нанометрового технологического процесса.
В конце 2021 г. Esperanto планирует запустить программу раннего доступа, в рамках которой заказчики получат возможность испытать ET-SoC-1.
Компания Esperanto была основана Дэйвом Дитцелем (Dave Ditzel) в 2014 г. Дитцель известен также как сооснователь ныне прекратившего существование американского чипмейкера Transmeta. За время своего существования с 1995 по 2008 г. Transmeta успела выпустить два процессора – Crusoe и Efficeon (VLIW-архитектура) – отличавшихся низким потреблением энергии и малым тепловыделением.
Характеристики чипов
Все чипы Epyc Rome поддерживают технологию многопоточности SMT (по два потока на ядро), могут работать с памятью DDR4-3200 в восьмиканальном режиме (до 4 ТБ), а также оснащены контроллером интерфейса PCI-E 4.0 на 128 линий.
Модель | Число ядер / потоков | Базовая тактовая частота (ГГц) | Максимальная тактовая частота (ГГц) | L3-кэш (МБ) | TDP (Вт) | Рекомендованная цена (доллары США) |
---|---|---|---|---|---|---|
AMD Epyc 7742 | 64 / 128 | 2,25 | 3,4 | 256 | 225 | 6 950 |
AMD Epyc 7702 | 64 / 128 | 2 | 3,35 | 256 | 200 | 6 450 |
AMD Epyc 7702P | 64 / 128 | 2 | 3,35 | 256 | 200 | 4 425 |
AMD Epyc 7642 | 48 / 96 | 2,3 | 3,3 | 256 | 225 | 4 775 |
AMD Epyc 7552 | 48 / 96 | 2,2 | 3,3 | 192 | 200 | 4 025 |
AMD Epyc 7542 | 48 / 96 | 2,9 | 3,4 | 128 | 225 | 3 400 |
AMD Epyc 7502 | 32 / 64 | 2,5 | 3,35 | 128 | 180 | 2 600 |
AMD Epyc 7502P | 32 / 64 | 2,5 | 3,35 | 128 | 180 | 2 300 |
AMD Epyc 7442 | 32 / 64 | 2,35 | 3,35 | 128 | 155 | 2 025 |
AMD Epyc 7402 | 24 / 48 | 2,8 | 3,35 | 128 | 180 | 1 783 |
AMD Epyc 7402P | 24 / 48 | 2,8 | 3,35 | 128 | 180 | 1 250 |
AMD Epyc 7352 | 24 / 48 | 2,3 | 3,2 | 128 | 155 | 1 350 |
AMD Epyc 7302 | 16 / 32 | 3 | 3,3 | 128 | 155 | 978 |
AMD Epyc 7302P | 16 / 32 | 3 | 3,3 | 128 | 155 | 825 |
AMD Epyc 7282 | 16 / 32 | 2,8 | 3,2 | 64 | 120 | 650 |
AMD Epyc 7272 | 12 / 24 | 2,9 | 3,2 | 64 | 120 | 625 |
AMD Epyc 7262 | 8 /16 | 3,2 | 3,4 | 128 | 155 | 575 |
AMD Epyc 7252 | 8 /16 | 3,1 | 3,2 | 64 | 120 | 475 |
AMD Epyc 7252P | 8 / 16 | 3,1 | 3,2 | 32 | 120 | 450 |
Размер кэш-памяти третьего уровня составляет от 32 до 256 МБ, штатный TDP варьируется от 120 до 225 Вт в зависимости от числа ядер и тактовой частоты.
Модуль «Управление уязвимостями» на платформе Security Vision: как выявить и устранить уязвимости в своей ИТ-инфраструктуре
Большая часть представителей линейки отличается поддержкой двухсокетных конфигураций, однако некоторые модели (с суффиксом “P” в названии) предназначены для работы «в одиночку».
Важно также отметить, что точно так же, как AMD Epyc первого поколения (Naples), представленные в мае 2017 г., процессоры Epyc Rome предназначены для установки в разъем Socket SP3, что даст возможность клиентам перейти с Naples на Rome без замены материнской платы.
Самый «бюджетный» из новых чипов – AMD Epyc 7252. Его рекомендованная цена составляет $475 (или $450 за версию, не поддерживающую двухпроцессорные конфигурации). Чип характеризуется таковой частотой 3,1-3,2 ГГц при весьма скромном TDP 120 Вт. Размер кэша составляет 64 МБ.
Флагман линейки – 64-ядерный AMD Epyc 7742 стоимостью $6,95 тыс. Он работает на частотах от 2,25 ГГц до 3,4 ГГц в турборежиме, может похвастаться 256 МБ кэш-памяти третьего уровня и стандартным показателем TDP в 225 Вт.
Data Fusion Awards: синергия разнородных данных становится неотъемлемой частью бизнеса, науки и государства
Напомним, что корпорация Intel в июле 2019 г. выпустила серверный процессор Xeon Platinum 8284 семейства Cascade Lake-SP стоимостью $15,5 тыс.
Наверняка вы подумали, что это какой-то очередной кликбейт. Что это за самый большой процессор в мире? Похоже сейчас нам будут рассказывать о процессоре, который на 5 процентов больше других, и то если рассматривать этот процессор только с определенной стороны. И да, просмотры и прочтения мы хотим собрать, но…
Сегодня мы расскажем вам о процессоре компании Церебро под названием Cerebras CS-1. И он действительно огромный!
Например, GPU, который считался самым большим раньше — это процессор Nvidia V100, а вот новый процессор Церебро. Он почти в 57 раз больше! Площадь самого чипа — 462 квадратных сантиметра — это почти столько же сколько площадь всей Nvidia 3090, вместе с системой охлаждения и разъемами.
А что вы скажете на то, что этот монстр способен симулировать некоторые физические модели быстрее самих законов физики? Заинтриговали? Что ж, тогда присаживайтесь, наливайте чаек. Сегодня будет разбор по-настоящему огромного однокристального процессора!
Итак, что же это за монстр такой и зачем он нужен? Давайте сразу ответим на второй вопрос — этот процессор создан для машинного обучения и искусственного интеллекта. Кроме того, он сильно расширит возможности для различного сложного моделирования и сможет заглядывать в будущее. Вообще, искусственный интеллект — это невероятно интересная и актуальная тема, а ее главные ограничения — это слабые вычислительные мощности. А если хотите узнать о реальных проектах с использованием искусственного интеллекта — у Илона Маска есть такой в запасе — Open AI.
Если вы думали, что закон Мура со своим увеличением количества транзисторов в процессоре каждые 1,5 года — это быстро, то посмотрите на потребности в области ИИ, ведь спрос на эти вычисления удваивается каждые 3,5 месяца!
Классический подход — это напихать кучу процессоров в серверные стойки, к каждому подвести систему охлаждения и питания, при этом каждый отдельный процессор еще надо связать друг с другом, а это, кстати, неизбежно вызывает задержки.
Скажем так — если вы возьмете двигатель от Ferrari и запихнете ее в старые Жигули, то машина конечно поедет быстрее, но как Ferrari все равно не поедет. Поэтому тут нужен принципиально иной подход, ведь для того, чтобы получить настоящий гиперкар надо взять хорошие тормоза, подвеску, рассчитать аэродинамику: с компьютерами точно также.
Компания Церебро это и сделала — они решили разработать свою систему с нуля, то есть вообще все — от архитектуры самих процессоров, до системы охлаждения и питания.
Это огромная машина, потребляющая 20 килоВатт, и занимающая треть стандартной серверной стойки, то есть можно размещать по три таких компьютера в одной стойке! А сам чип, по своей сути и предназначению, напоминает серверные GPU от NVIDIA, так что давайте их и сравним. Возьмем Nvidia Tesla V100.
Цифр много, приготовьтесь! Кроме размеров самого кристалла, процессор Церебро обладает четырьмя сотнями тысяч ядер, что в 78 раз больше, чем число ядер на NVIDIA Tesla V100! Количество транзисторов взрывает мозг — 1,2 триллиона, против 21 миллиарда у NVIDIA.
А сколько там памяти? 18 гигабайт l2 cache memory прямо на чипе! Это в три тысячи раз больше, чем у V100. Кстати у 3090 от той же NVIDIA, памяти на чипе тоже 6 мегабайт, прямо как у V100. Ну а про ширину полосы пропускания даже говорить страшно — у V100 это 300 Гигабит в секунду, а у Церебро — 100 ПЕТАбит в секунду. То есть разница в 33 тысячи раз!
А чтобы достичь схожей вычислительной мощности они заявляют, что нужна тысяча карт NVIDIA V100, что суммарно будет потреблять в 50 раз больше мощности и занимать в 40 раз больше места — это очень значительная экономия электроэнергии и свободного пространства.
Это конечно прекрасно — цифры поражают. Но как удалось их достичь?
Суть в размере. Чип — большой, нет, даже огромный. Именно это позволяет разместить столько всего на одном кристалле. И главное, что связь между элементами мгновенная, потому что не нужно заниматься сбором данных с разных чипов.
Однако, размер — это одновременно и главный недостаток Церебро.
Давайте по-порядку. Первое и главное — нагрев. Разработчики этого монстра прекрасно понимали, что они создают и какая система охлаждения нужна, поэтому она, как и сам процессор, были разработаны с нуля. Она представляет из себя комбинацию жидкостного охлаждения, которое направляется к охлаждаемым медным блокам! Охлаждающая жидкость, проходя через мощный насос, попадает в радиатор, где с помощью вентилятора происходит ее охлаждение, а горячий воздух уже выдувается наружу четырьмя дополнительными вентиляторами.
При потреблении 20 кВт, которые подаются через двенадцать разъемов питания, четыре уходит только на питание вентиляторов и насосов для системы охлаждения. Но в результате они достигли того, что чип работает при вдвое меньших температурах, чем стандартные GPU, что в конце концов повышает надежность всей системы.
Ну и конечно отдельно хочется сказать, что инженеры создали систему так, что она позволяет быстро менять почти любой компонент, что очень круто, так как в случае поломки — это уменьшает время возможного простоя.
Сам же чип собирает TSMC по, вы не поверите, 16 нанометровому техпроцессу. И тут вы можете справедливо возмутится. Как же так? Все уже делают чипы на 5 нм, какой смысл делать на древних 16 нм?
Тут то и скрывается вторая проблема. При производстве классических чипов неизбежно бывает брак, который приводит к тому, что несколько чипов оказываются негодными и выкидываются или используются для других задач, и чем мельче техпроцесс, тем выше процент брака. Но когда у тебя вся кремниевая подложка — это один чип, то любая ошибка в производстве приводит к тому, что всю пластину можно выкидывать. А при условии, что одна пластина может изготавливаться несколько месяцев и стоит около миллиона долларов, что ж….
Суть в том, что ребята решили, как бы подстраховаться. Ведь 16 нм техпроцессу уже почти семь лет: детали и тонкости при его производстве отлично изучены. Так сказать — уменьшают риски! Но стоит сказать, что уже ведется разработка и тестирование такого чипа на 7 нм, но его выход конечно будет зависеть от спроса на первое поколение! И там цифры просто огромные, только посмотрите на таблицу.
И тут вы можете справедливо заметить, что мы пока что ни слова не сказали о результатах, которых можно достичь с помощью этого монстра. Тут сложно, так как информация, в основном, закрытая, однако какие-то детали все равно просачиваются в медийное пространство.
Национальная лаборатория энергетических технологий Министерства энергетики США заявила, что CS-1 — первая система, которая смоделировала работу более миллиона топливных ячеек быстрее, чем в режиме реального времени.
Это означает, что когда CS-1 используется для моделирования, например, электростанции на основе данных о ее текущем состоянии, она может сказать, что произойдет в будущем быстрее, чем законы физики дадут такой же результат. Вы поняли? С помощью этого ПК можно заглянуть в будущее с высокой точностью, и если нужно подкорректировать и изменить его. И еще, например, в симуляции с 500 миллионами переменных Cerebras CS-1 уже обогнал суперкомпьютер Joule, занимающий 69-е место в рейтинге самых мощных суперкомпьютеров мира. Так что похоже со спросом проблем не ожидается.
Церебро планируется использовать для прогнозирования погоды или температуры внутри ядерного реактора или, например, проектирования крыльев самолета. Несомненно, лаборатории и различные исследовательские центры по всему миру найдут для Церебро области применения. Как вы понимаете, компьютер будет дорогим, но точная цена неизвестна.
Из открытых источников мы нашли только что в 2020 году в суперкомпьютерном центре Питтсбурга было куплено 2 компьютера Cerebras CS-1 за 5 миллионов долларов. Но система делается только под заказ и под каждого конкретного клиента, так что цена может варьироваться.
Выводы
Это явно уникальная система. И такого раньше никто не делал! Большинство производителей считают, что гораздо выгоднее и эффективнее наштамповать кучу маленьких процессоров, так как вероятность брака или поломки сильно падает и каждая ошибка сильно дешевле. Разработчики Церебро же решили пойти рискованным путем и, судя по тому, что процессор Cerebras CS-2 уже тестируют, их путь успешен.
И если все что они заявили — сбудется, то нас ждет абсолютно новая эра серверных вычислений, невероятные возможности для создания компьютерных моделей, новые мощности искусственного интеллекта. Нет сомнений, что и гиганты рынка, такие как Nvidia, Intel, Google, посмотрев на удачный опыт Церебро займутся разработкой своих огромных однокристальных систем. А вы только представьте, что будет если совместить это с квантовыми вычислениями, о которых мы недавно делали разбор? Ух!
Будем следить за развитием технологий, и продолжим дальше делать для вас такие интересные обзорные материалы про самые современные достижения!
PS. Кстати, лайк если поняли пасхалку в Церебро — ведь решетка радиатора выполнена в форме специальной сетки, которая используется в компьютерном моделировании для расчетов. Отсылка к предназначению Церебро!
В прошлом году компания Cerebras System представила самый большой в мире процессор. Его размеры составили 220 x 220 мм, площадь — 46 225 мм². Процессор включает 1,2 трлн транзисторов. Чип получил название WSE (Wafer Scale Engine). Представители компании разработали и компьютер CS-1, основой которого стал гигантский процессор. Систему официально представили 18 ноября 2019 года.
Сейчас Cerebras System рассказала о новом процессоре, количество транзисторов в котором увеличится более чем в 2 раза — с 1,2 трлн до 2,6 трлн. Резкое увеличение количества элементов в чипе стало возможным благодаря переходу на 7-нм техпроцесс. Кратно выросло и число ядер — их теперь 850 000.
Размеры первого процессора огромны — 22 x 22 см, что сопоставимо с размерами небольшого ноутбука. Он в 55.9 раз больше самого крупного GPU-чипа, Nvidia A100. Ну а CS-1 назван производителем «самым быстрым компьютером для работы с искусственным интеллектом и обучения нейросетей». Охлаждение — жидкостное с внутренним контуром и двумя насосами. Дополнительно установлены четыре крупных кулера, обеспечивающие скорость воздушного потока в 0,95 м 3 /с.
Процессор первого поколения включал 400 000 вычислительных ядер. Его оснастили 18 ГБ памяти формата SRAM, а пропускная способность при этом достигла 9 петабайт в секунду. Система потребляла 18 кВт энергии, которую подавали 12 блоков питания. Масса компьютера с установленным WSE — 254 килограмма. Для включения системы в единую сетевую инфраструктуру использовались 12 портов 100 Gigabit Ethernet (100GBase-SR4).
Wafer Scale Engine в сборе с системой питания и охлаждения
Генеральный директор и соучредитель Cerebras Systems Эндрю Фельдман на презентации новинки рассказывал, что CS-1 в три раза производительней кластеров TPU от Google. Вычислительные решения от поискового гиганта по энергетическим характеристикам оказались хуже разработки компании, потребляя более 100 кВт электроэнергии.
В 2019 году первые экземпляры CS-1 были переданы заказчикам. Среди них — Аргоннская национальная лаборатория министерства энергетики США, Суперкомпьютерный центр Питтсбурга и Ливерморская национальная лаборатория.
На конференции Hot Chips 2020 компания Cerebras System объявила, что перейдет с 16-нм техпроцесса на 7-нм. Производителем процессора останется тайваньская Taiwan Semiconductor Manufacturing Company (TSMC). Представитель разработчика заявил, что в лаборатории тестируется несколько образцов WSE нового поколения.
Ожидается, что Cerebras System увеличит объем доступной памяти чипа и усилит межкомпонентные соединения микросхем для повышения пропускной способности. Скорее всего, компания продолжит предоставлять в аренду вычислительные мощности для обучения нейросетей корпоративных клиентов. Кто станет клиентом, выяснится в ближайшем будущем, но можно быть уверенным в том, что желающих будет много.
Бессмысленная универсальность
По мнению специалистов профильного портала Tom’s Hardware, несмотря на все заверения в универсальности продукта со стороны Esperanto, ET-SoC-1 все же выглядит, скорее, как кастомный чип для решения задач в области ИИ. Наличие четырех высокопроизводительных ядер в данной конфигурации не делают погоды и вряд ли смогут составить конкуренцию современным решениям Intel, AMD и, вероятно, даже Arm – производительность ET-Maxion находится примерно на уровне Arm-A72.
WSE-2 в составе миниатюрного суперкомпьютера
Как и прежде, чип поставляется в составе специальной системы высотой 15U под названием CS-2. Миниатюрный суперкомпьютер включает все необходимые сетевые компоненты и систему водяного охлаждения, необходимые для его эксплуатации. Система в сборе потребляет около 17 кВт электроэнергии, что на 2 кВт меньше по сравнению с предыдущей моделью. По утверждению представителей Cerebras, вычислительная мощность CS-2 эквивалента «сотням серверов на базе GPU, потребляющих сотни киловатт».
Программное обеспечение, поставляемое Cerebras, дает возможность пользователям CS-2 создавать собственные модели машинного обучения с применением популярных фреймворков, например, PyTorch и TensorFlow.
Модуль «Управление уязвимостями» на платформе Security Vision: как выявить и устранить уязвимости в своей ИТ-инфраструктуре
CS-2 предназначена для применения в дата-центрах по обработке параллельных вычислений в области машинного обучения и искусственного интеллекта. Среди потенциальных клиентов – исследовательские лаборатории. Издание Tom’s Hardware отмечает, что продукт может заинтересовать военных и разведывательные структуры.
Что касается гражданского сектора, первую модель мини-суперкомпьютера, в частности, использует Аргоннская национальная лаборатория (подконтрольна Министерству энергетики США) для изучения рака и проведения фундаментальных исследований, к примеру, изучения черных дыр.
Новые процессоры и партнеры AMD
AMD официально представила процессоры для центров обработки данных Epyc Rome, выполненные на базе микроархитектуре Zen 2. Это первые в мире серверные процессоры с архитектурой x86, производящиеся по семинанометровому технологическому процессу. Применение новой архитектуры позволило добиться 15-процентного прироста числа инструкций, повышенной производительности и энергоэффективности.
Новые процессоры должны составить конкуренцию чипам Intel Xeon Scalable второго поколения (семейство Cascade Lake). В AMD утверждают, что Epyc Rome обеспечивают вдвое большую производительность в сравнении с Xeon, при этом они могут быть от двух до четырех раз дешевле решений Intel при сравнимой вычислительной мощи.
AMD также заявила, о том, что ей удалось привлечь Google и Twitter в качестве клиентов. Сервис микроблогов планирует внедрить новинки в собственных дата-центрах в этом году. Поисковый гигант уже использует процессоры во внутренних ЦОДах. Кроме американских интернет-гигантов в числе партнеров AMD, уже анонсировавших свои планы по использованию решений чипмейкера, значатся Microsoft, HPE, Cray, Lenovo и Dell.
К 2020 г. AMD намерена довести свою долю на рынке серверных процессоров до 10%. Сейчас она не превышает 3%.
Читайте также: