Процессор эльбрус сравнение с intel
Несомненно, отечественные процессоры в лице «Эльбрус» мягко говоря, уступают своим иностранным конкурентам. Однако давайте посмотрим внимательнее, насколько этот разрыв можно назвать гигантским.
Результаты
Тест | Байкал-М | Эльбрус-8СВ | Core i7-2600 |
---|---|---|---|
Dhrystone [DMIPS] | 8438 | 9077 | 22076 |
Whetstone [MWIPS] | 1608 | 2269 | 5729 |
Whetstone MP [MWIPS] | 12097 | 16495 | 31319 |
Linpack 100 [MFLOPS] | 1012 | 1723 | 4302 |
Scimark 2 [Composite score] | 473 | 908 | 2427 |
Coremark (1T;MT) | 7422; 58047 | 5500; 43008. 61871* (rtc x86-64) | 22692; 119670 |
MP MFLOPS | 49788 | 381326 | 81745 |
HPL [GFLOPS] | 38 | 244 | 93.9 |
7zip (Comp; Decomp; Tot) (MT) | 8483; 11252; 9868 | 8461; 13638; 11049 | 18024; 13363; 18664 |
STREAM (Copy; Scale; Add; Triad) [MB/s] | 12315; 12061; 11064; 11529 | 23097; 23137; 25578; 25643 | 20860; 21838; 18512; 20452 |
SPEC 2006 INT | 9.2 | 18 | 44.6 |
SPEC 2006 FP | 9 | 22.5 | |
Blender (RyzenGraphic_27) [min:sec] | 2:47 | 2:32 | 1:18 |
StockFish [nodes/sec] | 2750526 | 3123190 | 10860720 |
Octane 2 | 5266 | 2815*** | 24875 |
Sunspider 1.0.2 [ms] | 849.5 | 2394*** | 232.3 |
Kraken 1.1 [ms] | 4669.3 | 8714.2*** | 1287.8 |
* — В нативном режиме Эльбрус в тесте Coremark показывает в 1,5 раза хуже результаты чем в режиме бинарной трансляции x86-64 кода (этот бинарный транслятор называется RTC)
** — Результаты для процессора Эльбрус 8СВ уточняются у компании МЦСТ
*** — В JavaScript тестах Эльбрус достаточно отстаёт. Причина в том, что JIT-компиляция для JavaScript'а Эльбруса не достаточно глубоко реализована и есть куда улучшать. Во всех JS тестах использовался браузер Firefox. (На Эльбрусе только Firefox 52).
Снял видео с некоторыми тестами:
Результаты
Компилируемые тесты
ВНИМАНИЕ: Сборка тестов производилась с подбором флагов оптимизации и использования профилировщика и на результаты влияет версия компилятора (я являюсь энтузиастом и собирал код своими силами и, надеюсь, МЦСТ смогут собрать более правильно). Архитектура Эльбруса предполагает, что вы будете оптимизировать производительность не только флагами сборки, но и менять сам код (для бенчмарков это запрещено делать).
Тест
Эльбрус-16C
Эльбрус-8СВ
Core i7-2600
Dhrystone [DMIPS] (1 поток)
Whetstone [MWIPS] (1 поток)
Whetstone MP [MWIPS]
Linpack 100 [MFLOPS]
Scimark 2 [Composite score] (1 поток)
5500; 43008 / 61871* (rtc x86-64)
HPL [GFLOPS] (1T;MT)
7zip (Comp; Decomp; Tot) (MT)
19070; 33490; 26280 [v 16.02]
26039; 40040; 33039 [v 21.07]
8461; 13638; 11049
18024; 13363; 18664
STREAM (Copy; Scale; Add; Triad) [MB/s]
70389; 67256; 74444;
77148 (8 modules modules DDR4)
20090; 19408;21848;22284
(2 modules modules DDR4)
23097; 23137; 25578; 25643 (4 modules DDR4)
20860; 21838; 18512; 20452
SPEC 2006 FP (1T)
Blender (RyzenGraphic_27) [min:sec]
SuperPI [sec] (1 поток) (меньше – лучше)
Minerd [sha256d khash/s] (1T;MT)
Minerd [scrypt khash/s] (1T;MT)
(Core i5-6500)
* — В нативном режиме Эльбрус-8СВ в тесте Coremark показывает в 1,5 раза хуже результаты чем в режиме бинарной трансляции x86-64 кода (этот бинарный транслятор называется RTC). На Эльбрус-16С такой проблемы больше нет.
Geekbench 5 в бинарной трансляции RTC
ID
Name
Platform
Architecture
Single-core Score
Multi-core Score
MCST Elbrus 4C (х86 compatibility mode) 4 CPUs Intel Pentium II/III 750 MHz (1 cores)
74
374
MCST Elbrus 8C (х86 compatibility mode) Intel Pentium II/III 1299 MHz (1 cores)
140
937
MCST Elbrus 8CB (х86 compatibility mode) Intel Pentium II/III 1549 MHz (1 cores)
159
1100
MCST Elbrus 16C (х86 compatibility mode) Intel Pentium II/III 2000 MHz (1 cores)
203
2821
Core i7-2600Intel Core i7-2600 3401 MHz (4 cores)
720
2845
Немного об архитектурах процессоров Байкал-М и Эльбрус
PHP, Python
Выводы
Процессоры Байкал-М и Эльбрус-8СВ показывают примерно одинаковую производительность в большинстве задачах. Эльбрус-8СВ сильно выигрывает в "числодробилках", но проигрывает в тестах JavaScript (да и где есть интерпретация или JIT-компиляция в реалтайме).
Жду ваши предложения, какие ещё бенчмарки можно прогнать на этих компьютерах (желательно с простой сборкой).
Эта статья является продолжением моих предыдущих статей по бенчмаркам Эльбрусов:
Эльбрус-16С на архитектуре e2k-v6 является развитием процессора Эльбрус-8СВ (e2k-v5), который имеет 16 ядер на частоте 2 ГГц, поддержку аппаратной виртуализации, поддерживает до 4 ТБ оперативной памяти DDR4-3200, 32 линии PCIe 3.0.
Тестируемый процессор работает на материнской плате 1Э16С-mATX c двумя установленными модулями памяти DDR4 на частоте 2400.
Внимание: тестируется инженерный процессор с частично отключенным кешем, у серийного образца результаты должны быть лучше.
Фото инженерной платы из интернета (на фото плата не моего экземпляра):
К результатам процессоров Эльбрус-16С и Эльбрус-8СВ добавляю процессор Intel Core i7-2600 для относительного сравнения.
Характеристики сравниваемых процессоров:
Эльбрус-16СВ
Эльбрус-8СВ
Core i7-2600
* — У Intel Core i7-2600 частота бустится, ядер 4, но 8 потоков HT.
Список компилируемых тестов (на языках С и C++):
Dhrystone, Whetstone, Linpack 100, Scimark 2, SuperPI
TLB test, STREAM
HPL (High Performance Linpack)
7zip встроенный бенчмарк
StockFish (встроенный тест шахматного движка)
Cpu Miner (minerd)
Рендеринг в Blender (Файл для теста)
Готовые результаты в SPEC 2006
Теперь сразу перейдём к сводной таблице с результатами.
SPEC 2006 INT/FP
SPEC CPU2006 инструмент исследования производительности систем, который основан на коде реальных приложений, поставляются в виде исходного кода. Тест оценивает не только производительность процессора и памяти, но и показывает то, насколько компиляторы могут оптимизировать код.
Имеется 2 группы тестов:
- SPEC INT 2006, измеряющий производительность целочисленных вычислительных задач (integer);
- SPEC FP 2006, измеряющий производительность вычислительных задач с вещественными числами (числами с плавающей точкой, floating point).
Что имеем?
Ассортимент российских процессоров пока крайне скромный. Модели от 2С до 8С уже разработаны и используются в системах, предназначенных для корпоративного сектора. Основной сферой применения процессора Эльбрус-4С/8С будут являться серверы, настольные компьютеры, мощные встраиваемые вычислители. Модель 16С планируют выпустить в 2021 году. Сфера применения – суперкомпьютеры.
Частота
Одни из самых интересных вопросов – насколько российские изделия могут конкурировать с продукцией от компании Intel. В первую очередь давайте сравним частоты процессоров. Для примера возьмем несколько моделей от Intel, выпущенные одновременно с конкретными процессорами Эльбруса.
Несмотря на существенное отставание в частотах (в среднем 3 ГГц), темпы увеличения у Эльбруса сравнимы с Intel – увеличение частоты на 0,5 ГГц каждые 4 года. Вот только Интел уперлась практически в потолок 5 ГГц, поэтому для компании уменьшение темпов роста вполне очевидны.
Байкал-М
Байкал-М — процессор на основе 64 разрядной RISC архитектуре ARM (armv8, aarch64), имеет 8 ядер, которые реализуют микроархитектуру ядер Cortex-A57.
Схема микроархитектуры Cortex-A57:
Устройство конвейера Cortex-A57:
Особенности ядер Cortex-A57:
- 64 битная архитектура armv8.0a
- FP/SIMD расширения VFPv4 и NEON
- Внеочередное исполнение
- Предсказание ветвлений
- Поддержка виртуализации
- 8 портов на исполнение микроопераций:
- 2 Загрузки/Сохранения
- 2 простых АЛУ (сложение, сдвиг)
- 1 блок ветвлений
- 1 АЛУ для умножения, деления
- 2 блока SIMD/FPU
- 48 КБ L1 кэш команд (3 канальный, ассоциативный, размер линии 64 байта)
- 32 КБ L1 кэш данных (2 канальный, ассоциативный, размер линии 64 байта)
- 32 КБ L1 кэш данных (2 канальный, ассоциативный, размер линии 64 байта)
- В Байкал-М 1 МБ L2 на 1 кластер (2 ядра в кластере), в сумме 4 МБ
- Кэш L3: 8 МБ
Моё видео о сравнении Байкала и Эльбруса:
Blender
Эльбрус рендерит немного быстрее Байкала-М. Кстати, результат Эльбрус-8СВ не сильно отличается от Эльбрус-8С (разница с ростом частоты с 1300 до 1500 МГц), следовательно, требуются кое-какие оптимизации и использование SIMD, чтобы повысить результаты на Эльбрус-8СВ.
Whetstone
Тестирует арифметику с плавающей/фиксированной запятой, математические функции, ветвления, вызовов функций, присваиваний, работы с числами с фиксированной запятой, ветвлений. Результаты измеряются в MMIPS.
Эльбрус оказывается чуть быстрее в этом тесте чем Байкал-М. Ядра Эльбруса больше приспособлены для выполнения вещественной арифметики, но так как в наборе тестов есть и другие тесты, которые не поддаются распараллеливанию, то результаты выравниваются. Следовательно, в простых непараллельных математических и других программах эти процессоры будут показывать одинаковые результаты.
Число транзисторов
За 4 года компания «Эльбрус» смогла нарастить количество транзисторов на кристалле более чем в 7 раз! в целом к 2021 году российские продукты могут догнать американские процессоры по этому параметру.
Однако отставание к моменту 2020-2021 годов будет практически в 2 раза. Это сказывается на переходе компании Intel на техпроцесс в 10 нанометров.
Эльбрус – относительно сырой и существенно проигрывает своим конкурентам. Но с другой стороны далеко не каждая страна способна заняться разработкой собственных процессоров. Китай, например, активно разрабатывает свои процессоры Loongson. К 2020 году они обещают освоить техпроцесс 12 нанометров.
Национальные процессоры – это не прихоть. «Аппаратные закладки» для слежения пользователей неоднократно находили в продукции от Intel, поэтому неудивительно, что такие крупные страны как Китай и Россия хотят избавиться от зависимости американцев.
Недавно у меня по работе появился компьютер на базе процессора Байкал-М (BE-M1000), а также у меня есть удалённый доступ к компьютерам на процессорах Эльбрус, поэтому я решил сравнить их производительность в различных тестах.
Эта статья является продолжением моих предыдущих статей по бенчмаркам Эльбрусов:
К результатам процессоров Байкал-М и Эльбрус-8СВ я добавил процессор Intel Core i7-2600 для относительного сравнения.
Характеристики сравниваемых процессоров:
Байкал-М Эльбрус-8СВ Core i7-2600 Семейство ISA RISC VLIW CISC Архитектура armv8 e2k x86-64 Микроархитектура Cortex-A57 elbrus-v5 Sandy Bridge Частота (МГц) 1500 1500 3400* Ядра; Потоки 8 8 4; 8 Техпроцесс (нм) 28 28 32 TDP (Вт) 30-35 80-90 95 Тип ОЗУ DDR4-2400 DDR4-2400 DDR3-1333 Год 2018 2018 2011 * — У Intel Core i7-2600 часота бустится, да и ядер всего 4 с 8 потоками.
Кроме стандартных тестов Dhrystone и Whetstone, я решил включить следующие тесты:
- HPL (High Performance Linpack)
- 7zip встроенный бенчмарк
- StockFish (встроенный тест шахматного движка)
- Рендеринг в Blender (Файл для теста)
- Готовые результаты в SPEC 2006 (однопоток)
- JavaScript
Теперь сразу перейдём к сводной таблице с результатами.
Разбираем результаты
Dhrystone
Dhrystone достаточно древний тест 80х годов, написан на C. Тестирует целочисленную арифметику и работу со строками. Результаты измеряются в Dhrystone/s и DMIPS. (DMIPS = Dhrystone/s делить на 1757).
Эльбрус-16С немного показал хуже результаты чем Эльбрус-8СВ. Скорее всего, проблема с оптимизациями компилятором LCC, с новой версией будет перепроверяться.
Whetstone
Тестирует арифметику с плавающей/фиксированной запятой, математические функции, ветвления, вызовов функций, присваиваний, работы с числами с фиксированной запятой, ветвлений. Результаты измеряются в MMIPS.
Эльбрус-16С показывает результаты кратные частоте (2000 / 1500).
Coremark
Современный тест, который должен заменить Dhrystone и Whetstone. Написан на C. Считает различные массивы, матрицы, сортировка и т. д. Предназначался для запуска на всём: от микроконтроллеров до мощных процессоров.
Эльбрус-16С показывает гораздо лучшие результаты чем Эльбрус-8СВ. На 8СВ результаты в бинарной трансляции выходили лучше, чем нативные.
MP MFLOPS
Эльбрус-16С значительно обгоняет 8СВ, набирая более 1 ТFlops в числах с плавующей запятой одинарной точности.
HPL – переносимый высокопроизводительный тест, который используется для суперкомпьютеров. Решает системы линейных уравнений, использует библиотеки BLAS и MPI . Результаты выдаёт в GFLOPS.
Многие знают, что в России производятся процессоры «Эльбрус» и, исходя из мнений «диванных экспертов» делают ошибочные выводы о полной их непригодности. А между тем у «Эльбрусов» есть важнейшие критерии, по которым они превосходят процессоры AMD и Intel.
В России есть компания МЦСТ (Московский Центр Спарк Технологий), которая занимается разработкой отечественных процессоров «Эльбрус». Их архитектура и система команд является полностью отечественной разработкой.
реклама
Многие в кавычках технические эксперты, с просторов интернета преподносят нам информацию о полной никчемности и бесполезности этих процессоров. Подходят к этому вопросу однобоко, оценивают только их производительность, и совершенно не рассматривают другие важные критерии. Ссылаясь на проведенные сравнительные тесты с устаревшими процессорами, например с одним из таких как Intel Core i7 2600, в которых «Эльбрусы» в несколько раз уступают ему по производительности, ставят крест на «Эльбрусах».
При этом абсолютно не задумываясь, что у них совершенно другое назначение, и разрабатывались они не для игры в World of Tanks. Или аргументируют свои выводы тем, что даже Сбербанк отказался от использования серверов на базе «Эльбрусов» по причине их недостаточной производительности.
реклама
И да, бесспорно, производительность у «Эльбрусов» крайне низкая, даже по сравнению с устаревшим Intel Core i7 2600. Так в чем же «Эльбрусы», учитывая, что они направлены на государственный и оборонный сектор, могут превосходить подобных монстров, как AMD и Intel?
Чтобы ответить на этот вопрос, нужно вспомнить, какое главное требование предъявляется к вычислительным системам, которые обслуживают государственный и оборонный сектор. Этим требованием будет информационная безопасность.
Дыры в безопасности процессоров AMD и Intel
А какая может быть информационная безопасность у вычислительных систем на процессорах AMD и Intel? Правильно, никакая. Если на этапе их проектирования и производства, компании могут беспрепятственно вносить в них аппаратные закладки любого назначения. А после распространения этих процессоров по всему миру, скрытно собирать необходимые данные. Закладка – это скрытно встроенный в процессор аппаратный инструмент, при помощи которого заинтересованные лица могут получить доступ к конфиденциальным данным или к дистанционному управлению компьютером.
реклама
Кроме того у процессоров AMD и Intel имеется еще и большое количество аппаратных уязвимостей внесенных непреднамеренно, они в этом плане дырявые как решето.
Компания AMD и Intel признают наличие в своих процессорах непреднамеренных уязвимостей, и постоянно публикуют об этом отчеты.
реклама
А ведь это серверный сегмент, где безопасность информации святая святых. А насколько безопасно их можно использовать в оборонной сфере? А ведь это безопасность нашего государства.
Преимущества процессоров Эльбрус
В процессорах «Эльбрус», несмотря на то, что они производятся на производственных мощностях другого государства, Тайваньской компанией TSMC, вероятность внедрения «закладок» стремится к нулю. Поскольку компании TSMC не предоставляется вся документация на процессор, предоставляется только на фотошаблон. А определить по фотошаблону и по документации на него, как взаимодействуют миллиарды транзисторов между собой невозможно. А без понимания этого, не удастся разработать и внедрить в процессор какую-либо закладку. Кроме того в «Эльбрусах» используется технология «безопасных вычислений» позволяющая выявлять ошибки в ПО, которые могут использоваться как уязвимости. Аппаратная защита процессора обнаруживает подобные ошибки и блокирует возможность их исполнения. Так же высокую информационную безопасность обеспечивает и используемая для работы с «Эльбрусами» защищенная отечественная операционная система «Альт 8СП» и архитектура процессоров E2K, корни которой идут еще из СССР.
Основным отличием архитектуры E2K от других, является то, что распараллеливание потоков в ней осуществляется программным компилятором, который делает это значительно эффективнее, чем аппаратные компиляторы других архитектур. Поддерживает эта архитектура и ОС Windows, правда только в режиме эмуляции, преобразовывая коды «на лету» и теряя при этом до 30% производительности.
Таким образом, вычислительные системы, построенные на процессорах «Эльбрус» имеют все законные основания стать самыми надежными системами по обеспечению безопасности информации. И решение о выборе систем на «Эльбрусах» или на AMD и Intel, должно зависеть от того, какие критерии у пользователя в приоритете, общая производительность или информационная безопасность.
Многие скажут, что и в технологическом плане они значительно уступают другим процессорам.
Да, в некотором роде это так, техпроцесс, по которому будет производиться перспективный процессор «Эльбрус-16С» составит только 16 нм, а техпроцесс предыдущей версии «Эльбрус-8С» составляет 28 нм, что как в первом, так и во втором случае далеко до 7 нм процессоров AMD Ryzen. Но и этот недостаток, при некоторых обстоятельствах, например как при работе процессора в условиях ионизирующего излучения, вполне свойственного для оборонной сферы, оказывается преимуществом. Дело в том, что чем меньше физические размеры транзисторов процессора, тем меньше в них атомов вещества, и тем быстрее происходит разрушение их атомарной решетки под воздействием радиации. И напротив, более крупные транзисторы будут разрушаться медленнее, и работа процессора в целом под воздействием радиации будет более длительной.
Выводы
Таким образом, результатом всего вышесказанного является вывод, что процессоры «Эльбрус» предназначены для потребителя, у которого главным приоритетом является безопасность информации. К этой категории потребителей в первую очередь можно отнести государственный и оборонный сектор. И не корректно сравнивать «Эльбрусы» с процессорами AMD, Intel и другими. Это равносильно сравнению скоростей экскаватора и легковой машины, движущихся по дороге, и то и другое движется, но решаемые задачи абсолютно разные.
Надеюсь, моя статья была для вас интересна. Пишите в комментариях, что думаете вы о целесообразности существования и дальнейшего развития процессоров «Эльбрус».
Подпишитесь на наш канал в Яндекс.Дзен или telegram-канал @overclockers_news - это удобные способы следить за новыми материалами на сайте. С картинками, расширенными описаниями и без рекламы.
Реализация государственной программы импортозамещения продолжается. Результаты уже есть, но планы выходят далеко за пределы оборудования отечественными процессорами военных объектов. Уже в 2022 году стартуют продажи не только собранных в РФ, но и полностью состоящих их российских комплектующих компьютеров. На этот раз речь идёт не о закрытых тендерных продажах, а о продукции, которая появится на полках магазинов. Эксперты уверяют, что в ближайшее десятилетие мы станем свидетелями полномасштабной экспансии российских полупроводников, что приведёт к огромным инвестициям, ведь только массовый продукт способен стать успешным.
реклама
В оригинальном материале речь шла о компьютерах, построенных на процессорах «Байкал-М», вот только на отечественном рынке есть и другие продукты. Среди них новый Эльбрус-16С, который в настоящее время существует в виде инженерного образца и вот-вот отправится в серию. На сайте Habr уже проведены тесты данного камня, а мы перейдём к спецификациям. Новинка представляет собой логичное развитие процессора Эльбрус-8СВ и также выполнена на архитектуре e2k-v6. Эльбрус-16С включает 16 ядер, каждое из которых работает на тактовой частоте до 2 ГГц. В наличии поддержка массы современных технологий, включая до 1 Тб ОЗУ стандарта DDR4-3200 и до 32 линий по шине PCIe 3.0. Автор отмечает, что ему пришёл инженерный экземпляр, у которого пришлось подрезать кэш, а также снизить тактовую частоту оперативной памяти до 2400 МГц. Именно поэтому серийный процессор будет немного быстрее.
Изучить все тесты вы можете по ссылке. Заранее предупреждаем: результатов там очень много. Вам придётся потратить часы времени, чтобы всё это осознать, а мы предлагаем перейти к кратким выводам по ключевым бенчмаркам. Выше можно изучить любопытную таблицу по архиватору 7zip. Обратите внимание, что Эльбрус-16С показал результаты на уровне Celeron N3350, но есть и показатели процессора Huawei Kunpeng 920. Что до старого Core i7-2600, с которым проводится прямое сравнение, то здесь двукратная разница в производительности.
Разбираем результаты
MP MFLOPS и HPL
В данных тестах Эльбрус значительно вырывается вперёд, так как данные тесты максимально параллелятся на Эльбрусах. Это и понятно: Эльбрус заточен под числодробильные задачи, поэтому научные расчёты будут максимально быстрыми на Эльбрусах. Он в этом тесте даже обогнал Core i7-2600 в 4 раза.
Встроенный тест архиватора. Тест особо не параллелится, результаты примерно равные на этих процессорах (частота одинаковая).
Техпроцесс
Одним из важнейших показателей в производстве процессоров является техпроцесс. Чем тоньше толщина транзисторного слоя, тем больше транзисторов можно разместить на кристалле. Последние годы Intel застопорилась на 14 нм, а модели по техпроцессу в 10 нм будут только запущены в массовое производство. Однако проблемы американского гиганта несравнимы с темпами уменьшения техпроцесса в продуктах Эльбрус.
Минимизация техпроцесса у Эльбрус впечатляют, но не стоит забывать, что российские разработчики только подобрались к 16 нм, причем запуск модели 16С только планируется к 2021. У Intel уже будут образцы на 10 нм в следующем году. На даже они проигрывают, если сравнивать с продукцией от AMD, которая освоила 7 нм.
Браузерный JavaScript
Во всех JavaScript тестах использовался браузер Firefox, для Эльбрус 8СВ используется версия 52 (единственная доступная на данный момент версия браузера), на остальных — последняя. JavaScript на процессорах Эльбрус имеет достаточно низкую производительность (отставание в 2 раза относительно Байкал-М), детали о том как выполняли портирование можете посмотреть в статье Портирование JS на Эльбрус.
Количество ядер
Следующий немаловажный параметр – многодетность. Поскольку предел частоты практически достигнут, в последние годы число ядер стремительно наращивается. Насколько в этом плане отстает Эльбрус – давайте посмотрим…
Как видно, разработчики Эльбруса лишь слегка отстают от компании Intel, в целом на 2 ядра. При этом темпы развития сравнимы с десктопными процессорами. Естественно, в этой диаграмме не учитываются серверные решения от Intel, иначе проигрыш российской разработки будет более плачевным.
Coremark
Современный тест, который должен заменить Dhrystone и Whetstone. Написан на C. Считает различные массивы, матрицы, сортировка и т. д. Предназначался для запуска на всём: от микроконтроллеров до мощных процессоров.
В данном тесте Байкал-М оказывается в 1,5 раза быстрее Эльбруса. Но очень удивило то, что Эльбрус в режиме x86-64 трансляции показывает в 1,5 раза лучше результаты своего нативного варианта. (Следовательно, есть какие-то недоработки в компиляторе LCC).
Эльбрус-8СВ
Эльбрус-8СВ — процессор на основе 64 разрядной VLIW архитектуры E2K 5го поколения (e2k, elbrus-v5), имеет 8 ядер.
Схема микроархитектуры E2K:
Подробные детали микроархитектуры E2K:
Особенности ядер elbrus-v5:
- 64 битная VLIW архитектура elbrus-v5
- 128 (+ 8 бит на тег) разрядные регистры (были 80 бит + 4 бита на тег) и SIMD расширения
- 256 регистров (поддержка регистровых окон), 32 регистра из 256 — глобальные
- Предикатный файл на 64 бита (32 2 битовых флажков)
- 6 АЛУ блоков (с разными возможностями):
- 4 могут в Load
- 2 могут в Store
- 6 целых/сдвиговых АЛУ
- 6 вещественных АЛУ
- 4 сравнивающих блоков
- 4 целочисленных умножений
- 6 вещественных умножений
- 4 целочисленных векторных блоков
- 2 вещественных векторных блоков
- 1 деление и квадратный корень
- 128 КБ L1 кэш команд (4 канальный, ассоциативный, размер линии 256 байт)
- 64 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 32 байта)
- L2: 512 Кбайт в каждом ядре, 4 Мбайт суммарно (Размер линии: 64 байт, Ассоциативность: 4)
- L3: 16 Мбайт в процессоре (Размер линии: 64 байт, Ассоциативность: 16)
Dhrystone
Dhrystone достаточно древний тест 80х годов, написан на C. Тестирует целочисленную арифметику и работу со строками. Результаты измеряются в Dhrystone/s и DMIPS. (DMIPS = Dhrystone/s делить на 1757).
Байкал-М и Эльбрус показывают примерно одинаковые результаты. Тест особо не параллелится, поэтому на Эльбрусах все 6 АЛУ не загружаются. Это означает что в большинстве программ (а они не особо параллелятся на АЛУ), которые написаны на языках C, C++ и других компилируемых языках оба процессора будут показывать примерно равную производительность (оба имеют частоту в 1500 МГц).
Читайте также: