Как объединить ядра процессора в одно
Технологии постоянно развиваются и совершенствуются и сегодня на 9 из 10 компьютерах установлены многоядерные процессоры. И если двухъядерные сами по себе могут использовать оба ядра, то в случае с четырех- или восьмиядерными процессорами все не так очевидно.
Зачастую пользователи даже не знают о скрытом потенциале своего процессора и не используют его на полную мощь в играх или сложных программах. В нашей статье мы расскажем вам о том, как включить все ядра процессора в Windows 10 и получить более подробную информацию о процессоре.
Проверка данных и параметров процессора
Чтобы узнать, какое количество ядер задействовано системой, а также какие параметры есть у CPU, можно воспользоваться стандартными средствами операционной системы или сторонними программами.
Способы включения ядер процессора на Windows 10
Чтобы активировать все ядра четырехядерного (пример) процессора при включении ПК, можно использовать:
- Перенастройку конфигурации системы.
- Настройки BIOS.
Инструкция ниже подойдет как для 32-, так и для 64-битной ОС редакций Windows 10:
- Откройте меню «Выполнить», нажав на сочетание клавиш Windows + R. Введите msconfig и нажмите Enter, чтобы открыть окно конфигурации системы.
- Перейдите во вкладку «Загрузка», выберите нужную ОС и нажмите на функцию «Дополнительные параметры загрузки».
- Выберите строку «Число процессоров» и в развернутом списке выберите максимальное доступное количество ядер.
- Кроме этого следует повысить «Максимум памяти», отключить опцию «Блокировка PCI». В таком случае ОС будет распределять нагрузку на все ядра равномерно. Подтвердите настройки, нажав на OK.
_
Примечание. В настройках «Максимум памяти» нужно выбрать любое числовое значение не ниже 1024 Мбайт. Иначе скорость загрузки компьютера может и даже уменьшиться.
Чтобы не выполнять эти действия каждый раз, в предыдущем окне «Конфигурация системы» установите галочку на пункте «Сделать эти параметры загрузки постоянными». Подтвердите действия на «Применить» и OK.
Сторонние программы
Если вам мало «Диспетчера устройств», то можно воспользоваться сразу несколькими программами, предназначенными для проверки информации о системе и аппаратной части:
4х ядерный процессор. Приложение умеет использовать только 1 ядра одноврименно. Но его не хватает. Можно как-то обьяденить 2 процессорных ядра в 1, чтобы частота была больше?
Нужно использовать машину времени, чтобы телепортировать выхлоп одного ведра в начало работы второго.
Я слышал что в libastral.so добавили данный функционал.
Вопрос звучит комично и полностью безнадежно.
На заре многоядерности были некие программные решения таких проблем.
что за программа для начала
Модераторы запилите кнопку «Рассказать друзьям в VK»
Можно как-то обьяденить 2 процессорных ядра в 1, чтобы частота была больше?
Я разрешаю, объединяй.
Мальчик, сколько тебе лет?
[единственный_адекватный_комментарий_в_треде] Нельзя. [/единственный_адекватный_комментарий_в_треде]
Конечно! Достаточно создать ядерный RAID10
Даешь авторизвацию через вк. Принудительно.
Взять и объединить ядра нельзя. Но если задача, которую решает приложение, может быть разделена на две независимые части, то можно запустить две копии приложения, каждое из двух ядер будет нагружено работой и результат будет получен в два раза быстрее.
Нужно использовать машину времени, чтобы телепортировать выхлоп одного ведра в начало работы второго.
Так уже был топик про компьютер, выполняющий последовательные вычисления на одном и том же отрезке времени.
А ты уверен, что каждая копия будет собственное ядро пользовать?
Можно как-то обьяденить 2 процессорных ядра в 1
Конечно, нужно объединить их против общего врага, тебе осталось только этого врага найти.
Нет, не обязательно. Но тем не менее выигрыш по времени выполнения можно получить, если узким местом является именно производительность процессора.
Вангую, что бы топикстартер ни делал, его программы всегда будут бодаться за одно ведро. Это карма.
Но таки обращу внимание уважаемых ЛОРов еще раз, что на заре многоядрения были попытки распараллеливания однопоточных приложений.
Возможно мне это просто маразмится, но почему такое стойкое чувство дежавю?
This engine experiences technical issues on modern systems, particularly with fast, multi-core, or variable-speed processors. To resolve this issue, you may need to add -cpuspeed=xxx to the command line of Unreal Engine 1 games, where xxx is the CPU speed of the processor.
Потому что P(==|!=)NP. На ЛОРе такое дежавю каждую пятницу.
В архиваторе тар есть необходимый тебе функционал в общем ман тар, только надо самую свежую версию, которая есть в генте.
кароч, бирёшб виндовс 8 ,ставиш зверь ультимате твикер ,там на вкладке система-процессор вибираеш оптимезировать для однопотчьных приложений
видишь как просто. а местные питухи тебе росскажут и ни такое
Шедулер в ядре на что?
Два бана этому регистранту!
По теме - нет конечно. Обратись к разработчику, расскажи ему про то, какой сейчас год и про то, что в ходу процессоры с 6-8 ядрами.
Valkeru ★★★★ ( 03.11.13 04:45:26 )
Последнее исправление: Valkeru 03.11.13 04:46:42 (всего исправлений: 1)
Matlab R2012a тренировал нейросети на одном ядре, а R2012b на всех ядрах сразу.
Ты конечно отжог и над тобой сейчас круто постебуться (или уже стебуться. - тему не читал), но есть варик снять все другие процессы с этого ядра и выделить его только твоему коряво-архаичному приложению для однопроцессорных мейнфремов.
если я не ошибаюсь, именно такая возможность является фичей клеточных процессоров
ты спрашиваешь про частоту? ты действительно уверен в том, что справишься с такой высокой частотой процессора?
возьми микрокод процессора из ведра(он прошивается на загрузке ведра, гугли reprogrammable microcode и учебник по асму, если не понимаешь, о чем я)
и сделай аппаратную реализацию MPI
и как ты думаешь, зачем производители разделили мощность процессора на 4 ядра?
правильно! чтобы ты запускал 4 ведра линукс которые бы работали как одно только таких ос еще нет
Вроде бы. Но не забывай что у них киллер фичи - эта и то что их нет.
Не все родились бородатыми и олдскульными :) Лично я узнал такие подробности архитектуры ВС только в институте.
Хипсторы не нужны.
Общий ответ: нет, не всегда.
В частных случаях, вычисления можно распараллелить. Но озаботиться этим должен сначала программист, используя MPI или openMP
Пафосные анонимусы тем более ;)
возьми микрокод процессора из ведра(он прошивается на загрузке ведра
и как ты думаешь, зачем производители разделили мощность процессора на 4 ядра?
1) упёрлись в предел, за которым наращивать частоту процессора не удаётся.
2) чтобы несколько задач могли работать, не конкурируя за процессорное время, т.е. никак не теряя производительность от того, что параллельно запущена другая задача. Особенно способствует запуску виртуальных машин :)
3) чтобы распараллелить то, что можно распараллелить
Нельзя, покупай сразу одноядерный проц.
Shaman007 tazhate кто-нибудь проследите чтобы ОП выполнил домашку которую ему задали на каникулы.
упёрлись в предел, за которым наращивать частоту процессора не удаётся
s/не удаётся/менее выгодно, чем другие варианты/
Ладно, был неправ
мощность теплового излучения суммируется автоматом. А вот для того чтобы одну нить растянуть по ядрам ничего на ум не приходит
Это лишнее, а такой эпик можно и в вк рассказать.
отключи гипертрединг и два логических ядра волшебным образом станут одним физическим
Можно. Поковыряйся в настройках BIOS'а. Возможно еще прийдется перепрошить биосы каждого ядра
Будь в курсе последних новостей из мира гаджетов и технологий
Преимущества и недостатки включения всех ядер процессора
Для реализации всех возможностей имеющегося у пользователя процессора, конечно, желательно активировать все его ФП. Даже если выполняется одна задача, при правильном распределении потоков, остальные ядра будут находиться в режиме ожидания и их работа не окажет никакого влияния на энергопотреблении всей системы.
В настоящее время трудно найти программу, не использующую многопоточность. Даже офисные приложения, казалось бы, уж на что простые, но и в них используется эта технология.
Единственным плюсом «одноядерности», то есть отключения всех ядер у ЦП, кроме одного, является необходимость экономии энергии в мобильных устройствах – ноутбуках или нетбуках.
Ну и конечно, обязательно стоит упомянуть главный минус «многоядерности»: даже при небольшой загрузке всех ядер энергопотребление ЦП возрастает в разы. Это увеличивает его износ, износ системы охлаждения и величину потребляемой электроэнергии.
Внимание! Мощность современных ЦП составляет десятки, очень редко сотни ватт в пике производительности. Среднее же энергопотребление ЦП равняется примерно 40-50 ватт. Для стационарных систем это совсем немного, а вот для ноутбуков весьма критично.
Запуск и отключение ядер процессора
Надёжнее всего осуществлять запуск или отключения ФП при помощи настроек BIOS. Способ этот хорош тем, что он в 100% случаев гарантирует их включение или отключение, но, самое главное – делает это перед загрузкой ОС, что в случае установок «по умолчанию» заставит её использовать все имеющиеся в наличии ФП.
К сожалению, единой инструкции, как это можно сделать, не существует, поскольку опции включения дополнительных компонентов ЦП в BIOS от разных производителей может быть где угодно.
Чаще всего раздел, в котором указывается количество работающих ФП, называется «CPU Settings», а искомый параметр имеет имя «Number of cores», «Cores activated» и тому подобное. Необходимо в него записать максимально возможное значение, которое позволит система, и выйти из BIOS, выбрав опцию «Save settings and exit».
Стандартные средства ОС Windows 10
- Наведите курсор мыши на кнопку «Пуск» в левом нижнем углу экрана, щелкните правой кнопкой мыши и выберите «Параметры».
- Зайдите в категорию «Система».
- Откройте подкатегорию «О системе». Появится страница с информацией, где также будут указаны названия и частоты каждого из ядер.
Чтобы найти более подробную информацию обо всех устройствах, нужно открыть «Диспетчер устройств» (DEVMGMT.MSC).
Разверните ветку «Процессоры» и изучите графики (для четырехъядерного процессора их должно быть четыре и т. д.). Наведите курсор на любую строку, щелкните ПКМ и выберите опцию «Свойства». Здесь и будет вся необходимая информация о процессоре.
Почему количество ядер в процессорах не растет больше нескольких штук
В одной из предыдущих статей я рассказал, почему рост частоты процессоров застопорился на нескольких гигагерцах. Теперь же поговорим о том, почему развитие числа ядер в пользовательских процессорах также идет крайне медленно: так, первый честный двухядерный процессор (где оба ядра были в одном кристалле), построенный на архитектуре x86, появился аж в 2006 году, 12 лет назад — это была линейка Intel Core Duo. И с тех пор 2-ядерные процессоры с арены не уходят, более того — активно развиваются: так, буквально на днях вышел ноутбук Lenovo с процессором, построенном на новейшем (для архитектуры x86) 10 нм техпроцессе. И да, как вы уже догадались, этот процессор имеет ровно 2 ядра.
Архитектура CPU
Изначально все процессоры Intel x86 строились на архитектуре CISC (Complex Instruction Set Computing, процессоры с полным набором инструкций) — то есть в них реализовано максимальное число инструкций «на все случаи жизни». С одной стороны, это здорово: так, в 90-ые годы CPU отвечал и за рендеринг картинки, и даже за звук (был такой лайфхак — если игра тормозит, то может помочь отключение в ней звука). И даже сейчас процессор является эдаким комбайном, который может все — и это же является и проблемой: распараллелить случайную задачу на несколько ядер — задача не тривиальная. Допустим, с двумя ядрами можно сделать просто: на одно ядро «вешаем» систему и все фоновые задачи, на другое — только приложение. Это сработает всегда, но вот прирост производительности будет далеко не двукратным, так как обычно фоновые процессы требуют существенно меньше ресурсов, чем текущая тяжелая задача.
Слева — схема GPU Nvidia GTX 980 Ti, где видно 2816 CUDA-ядер, объединенных в кластеры. Справа — фотография кристалла процессора AMD Ryzen, где видно 4 больших ядра.
С видеокартами же все проще: GPU, по сути, занимается расчетами и только ими, причем число разновидностей расчетов ограничено и невелико. Поэтому, во-первых, можно оптимизировать сами вычислительные ядра (у Nvidia они называются CUDA) именно под нужные задачи, а, во-вторых — раз все возможные задачи известны, то процесс их распараллеливания трудностей не вызывает. И в-третьих, управление идет не отдельными шейдерами, а вычислительными модулями, которые включают в себя 64-192 шейдера, поэтому большое число шейдеров проблемой не является.
Энергопотребление
Одной из причин отказа от дальнейшей гонки частот — резкое увеличение энергопотребления. Как я уже объяснял в статье с замедлением роста частоты CPU, тепловыделение процессора пропорционально кубу частоты. Иными словами, если на частоте в 2 ГГц процессор выделяет 100 Вт тепла, что в принципе можно без проблем отвести воздушным кулером, то на 4 ГГц получится уже 800 Вт, что возможно отвести в лучшем случае испарительной камерой с жидким азотом (хотя тут следует учитывать, что формула все же приблизительная, да и в процессоре есть не только вычислительные ядра, но получить порядок цифр с ее помощью вполне можно).
Поэтому рост вширь был отличным выходом: так, грубо говоря, двухядерный 2 ГГц процессор будет потреблять 200 Вт, а вот одноядерный 3 ГГц — почти 340, то есть выигрыш по тепловыделению больше чем на 50%, при этом в задачах с хорошей оптимизацией под многопоточность низкочастотный двухядерный CPU будет все же быстрее высокочастотного одноядерного.
Пример испарительной камеры с жидким азотом для охлаждения экстремально разогнанных CPU.
Поэтому производителям CPU приходится следить за тем, чтобы при росте ядер не страдала однопоточная производительность, а с учетом того, что предел отвода тепла в обычном домашнем ПК был «нащупан» уже достаточно давно (это около 60-100 Вт) — способов увеличения числа ядер при такой же одноядерной производительности и таком же тепловыделении всего два: это или оптимизировать саму архитектуру процессора, увеличивая его производительность за такт, или же уменьшать техпроцесс. Но, увы, и то и другое идет все медленнее: за более чем 30 лет существования x86 процессоров «отполировано» уже почти все, что можно, поэтому прирост идет в лучшем случае 5% за поколение, а уменьшение техпроцесса дается все труднее из-за фундаментальных проблем создания корректно функционирующих транзисторов (при размерах в десяток нанометров уже начинают сказываться квантовые эффекты, трудно изготовить подходящий лазер, и т.д.) — поэтому, увы, увеличивать число ядер все сложнее.
Размер кристалла
Если мы посмотрим на площадь кристаллов процессоров лет 15 назад, то увидим, что она составляет всего около 100-150 квадратных миллиметров. Около 5-7 лет назад чипы «доросли» до 300-400 кв мм и. процесс практически остановился. Почему? Все просто — во-первых, производить гигантские кристаллы очень сложно, из-за чего резко возрастает количество брака, а, значит, и конечная стоимость CPU.
Во-вторых, возрастает хрупкость: большой кристалл может очень легко расколоть, к тому же разные его края могут греться по-разному, из-за чего опять же может произойти его физическое повреждение.
Сравнение кристаллов Intel Pentium 3 и Core i9.
Ну и в-третьих — скорость света также вносит свое ограничение: да, она хоть и велика, но не бесконечна, и с большими кристаллами это может вносить задержку, а то и вовсе сделать работу процессора невозможной.
В итоге максимальный размер кристалла остановился где-то на 500 кв мм, и вряд ли уже будет расти — поэтому чтобы увеличивать число ядер, нужно уменьшать их размеры. Казалось бы — та же Nvidia или AMD смогли это сделать, и их GPU имеют тысячи шейдеров. Но тут следует понимать, что шейдеры полноценными ядрами не являются — к примеру, они не имеют собственного кэша, а только общий, плюс «заточка» под определенные задачи позволила «выкинуть» из них все лишнее, что опять же сказалось на их размере. А CPU же не только имеет полноценные ядра с собственным кэшем, но зачастую на этом же кристалле расположена и графика, и различные контроллеры — так что в итоге опять же чуть ли не единственные способы увеличения числа ядер при том же размере кристалла — это все та же оптимизация и все то же уменьшение техпроцесса, а они, как я уже писал, идут медленно.
Оптимизация работы
Представим, что у нас есть коллектив людей, выполняющих различные задачи, некоторые из которых требуют работы нескольких человек одновременно. Если людей в нем двое — они смогут договориться и эффективно работать. Четверо — уже сложнее, но тоже работа будет достаточно эффективной. А если людей 10, а то и 20? Тут уже нужно какое-то средство связи между ними, в противном случае в работе будут встречаться «перекосы», когда кто-то будет ничем не занят. В процессорах от Intel таким средством связи является кольцевая шина, которая связывает все ядра и позволяет им обмениваться информацией между собой.
Чем больше ядер, тем хуже они работают вместе, вплоть до нулевого прироста производительности при увеличении числа ядер.
Поэтому число ядер особого смысла наращивать нет — прирост от каждого нового ядра будет все ниже. Причем решить эту проблему достаточно трудно — нужно разработать такую шину, которая позволяла бы передавать данные между любыми двумя ядрами с одинаковой задержкой. Лучше всего в таком случае подходит топология звезда — когда все ядра должны быть соединены с концентратором, но на деле такой реализации еще никто не сделал.
Так что в итоге, как видим, что наращивание частоты, что наращивание числа ядер — задача достаточно сложная, а игра при этом зачастую не стоит свеч. И в ближайшем будущем вряд ли что-то серьезно изменится, так как ничего лучше кремниевых кристаллов пока еще не придумали.
На сегодняшний день возможно построение домашнего суперкомпьютера, о чем и пойдет речь.
В статье рассмотрены способы аппаратного построения высокопроизводительных вычислительных комплексов. Одно из интересных применений – криптография. Например, благодаря современным технологиям, любому стал доступен взлом MD5 или WPA. Если постараться (информацию быстро выпиливают), в Интернете можно найти способ взлома алгоритма A5/2, используемого в GSM. Другое применение – инженерные, финансовые, медицинские расчеты, биткойнмайнинг.
Немного истории
Датой первого письменного упоминания о суперкомпьютерах можно считать 1 марта 1920 года. Нью Йоркские газеты писали о машинах мощностью в сто математиков. Это были табуляторы – электромеханические вычислительные машины, производимые компанией IBM (которая тогда называлась еще CTR). В дальнейшем вычислительные машины стали электронными. На рынке суперкомпьютеров образовалось несколько игроков, таких как Cray, HP, IBM, Nec. Эти компьютеры имели векторные процессоры (то есть оперировали не отдельными числами, а векторами). Для коммуникации между вычислительными узлами использовались проприетарные технологии фирм-производителей. Например, одна из таких технологий – соединение процессоров по топологии четырехмерного тора — за этими словами скрывается очень простой смысл: каждый узел связан с шестью другими. Дальнейшее развитие суперкомпьютеров породило направление массово параллельных систем и кластеров. В кластерах как квинтэссенции этого направления используются примерно те же алгоритмы коммуникации между вычислительными узлами, что и в суперкомпьютерах, только на базе сетевых интерфейсов. Они и являются слабым местом таких систем. Помимо нестандартной (по сравнению с классической звездой) топологии сети как Fat Tree, «многомерный тор» или Dragonfly, требуются специальные коммутационные устройства.
Касаясь взятой нами темы, нельзя не упомянуть, что сегодня одно из перспективных направлений развития суперкомпьютеров является использование в стандартной компьютерной архитектуре сопроцессоров, по архитектуре напоминающих видеокарты.
Выбор процессора
Сегодня основные производители процессоров – это Intel и AMD. RISC-процессоры, такие как Power 7+, несмотря на привлекательность, достаточно экзотичны и дороги. Вот, например, не самая новая модель такого сервера стоит больше миллиона.
(К слову, говоря, при этом есть возможность собрать недорогой и эффективный кластер из xbox 360 или PS3, процессоры там примерно как Power, и на миллион можно купить не одну приставку.)
Исходя из этого отметим интересные по цене варианты построения высокопроизводительной системы. Разумеется, она должна быть многопроцессорной. У Intel для таких задач используются процессоры Xeon, у AMD – Opteron.
Если много денег
Отдельно отметим крайне дорогую, но производительную линейку процессоров на сокете Intel Xeon LGA1567.
Топовый процессор этой серии – E7-8870 с десятью ядрами 2,4 ГГц. Его цена $4616. Для таких CPU фирмы HP и Supermicro выпускают! восьмипроцессорные! серверные шасси. Восемь 10-ядерных процессоров Xeon E7-8870 2.4 ГГц с поддержкой HyperThreading поддерживают 8*10*2=160 потоков, что в диспетчере задач Windows отображается как сто шестьдесят графиков загрузки процессоров, матрицей 10x16.
Для того, чтобы восемь процессоров уместились в корпусе, их размещают не сразу на материнской плате, а на отдельных платах, которые втыкаются в материнскую плату. На фотографии показаны установленные в материнскую плату четыре платы с процессорами (по два на каждой). Это решение Supermicro. В решении HP на каждый процессор приходится своя плата. Стоимость решения HP составляет два-три миллиона, в зависимости от наполнения процессорами, памятью и прочим. Шасси от Supermicro стоит $10 000, что привлекательнее. Кроме того в Supermicro можно поставить четыре сопроцессорных платы расширения в порты PCI-Express x16 (кстати, еще останется место для Infiniband-адаптера чтобы собирать кластер из таких), а в HP только две. Таким образом, для создания суперкомпьютера восьмипроцессорная платформа от Supermicro привлекательнее. На следующем фото с выставки представлен суперкомпьютер в сборе с четырьмя GPU платами.
Однако это очень дорого.
Что подешевле
Зато есть перспектива сборки суперкомпьютера на более доступных процессорах AMD Opteron G34, Intel Xeon LGA2011 и LGA 1366.
Чтобы выбрать конкретную модель, я составил таблицу, в которой сосчитал для каждого процессора показатель цена/(число ядер*частота). Я отбросил из расчета процессоры частотой ниже 2 ГГц, и для Intel — с шиной ниже 6,4GT/s.
Модель | Кол-во ядер | Частота | Цена, $ | Цена/ядро, $ | Цена/Ядро/ГГц |
AMD | | | | | |
6386 SE | 16 | 2,8 | 1392 | 87 | 31 |
6380 | 16 | 2,5 | 1088 | 68 | 27 |
6378 | 16 | 2,4 | 867 | 54 | 23 |
6376 | 16 | 2,3 | 703 | 44 | 19 |
6348 | 12 | 2,8 | 575 | 48 | 17 |
6344 | 12 | 2,6 | 415 | 35 | 13 |
6328 | 8 | 3,2 | 575 | 72 | 22 |
6320 | 8 | 2,8 | 293 | 37 | 13 |
INTEL | | | | | |
E5-2690 | 8 | 2,9 | 2057 | 257 | 89 |
E5-2680 | 8 | 2,7 | 1723 | 215 | 80 |
E5-2670 | 8 | 2,6 | 1552 | 194 | 75 |
E5-2665 | 8 | 2,4 | 1440 | 180 | 75 |
E5-2660 | 8 | 2,2 | 1329 | 166 | 76 |
E5-2650 | 8 | 2 | 1107 | 138 | 69 |
E5-2687W | 8 | 3,1 | 1885 | 236 | 76 |
E5-4650L | 8 | 2,6 | 3616 | 452 | 174 |
E5-4650 | 8 | 2,7 | 3616 | 452 | 167 |
E5-4640 | 8 | 2,4 | 2725 | 341 | 142 |
E5-4617 | 6 | 2,9 | 1611 | 269 | 93 |
E5-4610 | 6 | 2,4 | 1219 | 203 | 85 |
E5-2640 | 6 | 2,5 | 885 | 148 | 59 |
E5-2630 | 6 | 2,3 | 612 | 102 | 44 |
E5-2667 | 6 | 2,9 | 1552 | 259 | 89 |
X5690 | 6 | 3,46 | 1663 | 277 | 80 |
X5680 | 6 | 3,33 | 1663 | 277 | 83 |
X5675 | 6 | 3,06 | 1440 | 240 | 78 |
X5670 | 6 | 2,93 | 1440 | 240 | 82 |
X5660 | 6 | 2,8 | 1219 | 203 | 73 |
X5650 | 6 | 2,66 | 996 | 166 | 62 |
E5-4607 | 6 | 2,2 | 885 | 148 | 67 |
X5687 | 4 | 3,6 | 1663 | 416 | 115 |
X5677 | 4 | 3,46 | 1663 | 416 | 120 |
X5672 | 4 | 3,2 | 1440 | 360 | 113 |
X5667 | 4 | 3,06 | 1440 | 360 | 118 |
E5-2643 | 4 | 3,3 | 885 | 221 | 67 |
Жирным курсивом выделена модель с минимальным показателем соотношения, подчеркнутым – самый мощный AMD и на мой взгляд наиболее близкий по производительности Xeon.
Таким, образом, мой выбор процессоров для суперкомпьютера – Opteron 6386 SE, Opteron 6344, Xeon E5-2687W и Xeon E5-2630.
Материнские платы
PICMG
На обычные материнские платы невозможно поставить более четырех двухслотовых плат расширения. Есть и другая архитектура – использование кросс-плат, таких как BPG8032 PCI Express Backplane.
В такую плату ставятся платы расширения PCI Express и одна процессорная плата, чем-то похожая на те, которые установлены в восьмипроцессорных серверах на базе Supermicro, о которых речь шла выше. Но только эти процессорные платы подчиняются отраслевым стандартам PICMG. Стандарты развиваются медленно и такие платы зачастую не поддерживают самые современные процессоры. Максимум такие процессорные платы сейчас выпускают на два Xeon E5-2448L — Trenton BXT7059 SBC.
Стоить такая система будет без GPU не меньше $5000.
Готовые платформы TYAN
За ту же примерно сумму можно приобрести готовую платформу для сборки суперкомпьютеров TYAN FT72B7015. В такой можно установить до восьми GPU и два Xeon LGA1366.
«Обычные» серверные материнские платы
Для LGA2011
Supermicro X9QR7-TF — на эту материнскую плату можно установить 4 Платы расширения и 4 процессора.
Supermicro X9DRG-QF — эта плата специально разработана для сборки высокопроизводительных систем.
Для Opteron
Supermicro H8QGL-6F — эта плата позволяет установить четыре процессора и три платы расширения
Усиление платформы платами расширения
Этот рынок почти полностью захвачен NVidia, которые выпускают помимо геймерских видеокарт еще и вычислительные карты. Меньшую долю рынка имеет AMD, и относительно недавно на этот рынок пришла корпорация Intel.
Особенностью таких сопроцессоров является наличие на борту большого объема оперативной памяти, быстрые расчеты с двойной точностью и энергоэффективность.
FP32, Tflops | FP64, Tflops | Цена | Память, Гб | |
Nvidia Tesla K20X | 3.95 | 1.31 | 5.5 | 6 |
AMD FirePro S10000 | 5.91 | 1.48 | 3.6 | 6 |
Intel Xeon Phi 5110P | 1 | 2.7 | 8 | |
Nvidia GTX Titan | 4.5 | 1.3 | 1.1 | 6 |
Nvidia GTX 680 | 3 | 0.13 | 0.5 | 2 |
AMD HD 7970 GHz Edition | 4 | 1 | 0.5 | 3 |
AMD HD 7990 Devil 13 | 2x3,7 | 2х0.92 | 1.6 | 2x3 |
Топовое решение от Nvidia называется Tesla K20X на архитектуре Kepler. Именно такие карты стоят в самом мощном в мире суперкомпьютере Titan. Однако недавно Nvidia выпустила видеокарту Geforce Titan. Старые модели были с урезанной производительностью FP64 до 1/24 от FP32 (GTX680). Но в Титане производитель обещает довольно высокую производительность в расчетах с двойной точностью. Решения от AMD тоже неплохи, но они построены на другой архитектуре и это может создать трудности для запуска вычислений, оптимизированных под CUDA (технология Nvidia).
Решение от Intel — Xeon Phi 5110P интересно тем, что все ядра в сопроцессоре выполнены на архитектуре x86 и не требуется особой оптимизации кода для запуска расчетов. Но мой фаворит среди сопроцессоров – относительно недорогая AMD HD 7970 GHz Edition. Теоретически эта видеокарта покажет максимальную производительность в расчете на стоимость.
Можно соединить в кластер
Для повышения производительности системы несколько компьютеров можно объединить в кластер, который будет распределять вычислительную нагрузку между входящими в состав кластера компьютерами.
Использовать в качестве сетевого интерфейса для связи компьютеров обычный гигабитный Ethernet слишком медленно. Для этих целей чаще всего используют Infiniband. Хост адаптер Infiniband относительно сервера стоит недорого. Например, на международном аукционе Ebay такие адаптеры продают по цене от $40. Например, адаптер X4 DDR (20Gb/s) обойдется с доставкой до России примерно в $100.
При этом коммутационное оборудование для Infiniband стоит довольно дорого. Да и как уже было сказано выше, классическая звезда в качестве топологии вычислительной сети – не лучший выбор.
Однако хосты InfiniBand можно подключать друг к другу напрямую, без свича. Тогда довольно интересным становится, например, такой вариант: кластер из двух компьютеров, соединенных по infiniband. Такой суперкомпьютер вполне можно собрать дома.
Сколько нужно видеокарт
В самом мощном суперкомпьютере современности Cray Titan отношение процессоров к «видеокартам» 1:1, то есть в нем 18688 16-ядерных процессоров и 18688 Tesla K20X.
В Тяньхэ-1А – китайском суперкомпьютере на ксеонах отношение следующее. Два шестиядерных процессора к одной «видюшке» Nvidia M2050 (послабее, чем K20X).
Итак, сколько стоит
Представленные ниже варианты – шасси суперкомпьютера без оперативной памяти, жестких дисков и ПО. Во всех моделях используется видеоадаптер AMD HD 7970 GHz Edition. Его можно заменить на другой, по требованию задачи (например, на xeon phi). Там, где система позволяет, одна из AMD HD 7970 GHz Edition заменена на трехслотовую AMD HD 7990 Devil 13.
Современные центральные процессоры (ЦП) обладают несколькими ядрами или, как их ещё называют, физическим процессорами (ФП). Операционные системы (ОС), под управлением которых работают персональные компьютеры (ПК) могут использовать несколько ФП для оптимизации мультизадачности. Проще говоря, каждое приложение может выполняться на каком-то одном ядре одновременно с другими приложениями на других ядрах. Число ядер, таким образом, существенно влияет на быстродействие системы в целом.
Иногда вследствие использования различных режимов экономии энергии или повышения времени автономной работы ПК некоторые ФП могут быть отключены и в дальнейшем системой не задействованы. Всё это может приводить к уменьшению быстродействия ПК в целом.
Рассмотрим, как включить второе (третье, четвёртое и т.д.) ядро процессора.
В операционной системе Виндовс можно посмотреть количество работающих ядер можно двумя способами:
- с помощью диспетчера устройств;
- во вкладке «Быстродействие» диспетчера задач.
В первом случае мы можем увидеть количество логических процессоров (ЛП). Если используется технология HyperTreading, то число физических будет в два раза меньше.
Во втором случае число хронологий загрузки также будет равно числу ЛП.
Следует понимать, что максимальное значение количества используемых физических процессоров может отличаться от задействованных в настоящее время.
Узнать это значение средствами ОС, доступными пользователям по умолчанию не представляется возможным. Для этого существуют сторонние программы, например, CPU-Z или AIDA. Первая показывает число работающих ФП и их максимально возможное количество на своей основной панели. Чтобы увидеть эту же информацию в программе AIDA, следует в ней зайти во вкладку «ЦП».
Количество работающих ядер по умолчанию в Windows 10
На каждое отдельное ядро может оказываться разная нагрузка, что связано с изменением загруженности ПК. Настройки BIOS позволяют задать отдельную рабочую частоту для ядер. При равномерном распределении нагрузки на ПК пользователь получат высокую производительность.
Если говорить о двухъядерном процессоре, то лишь в одном случае будет задействовано всего лишь одно ядро – при загрузке компьютера. С другой стороны, всегда есть возможность активировать все ресурсы, чтобы ускорить процесс загрузки (с другой стороны, загрузка Windows это не самый требовательный к CPU процесс, и вы выиграете намного больше, если просто поставите свою Windows 10 на SSD).
Настройки процессора в BIOS
Изменять настройки BIOS нужно лишь в том случае, если ПК просто не загружается. Не нужно использовать данный метод, если у вас нет каких-либо начальных знаний по работе в BIOS. Лучше воспользуйтесь предыдущей инструкцией.
Для активации всех ядер многоядерного процессора через BIOS выполните следующие действия:
- Войдите в меню BIOS (перезагрузите компьютер и на начальном экране с информацией о материнской плате нажмите на F3,Del или Esc – зависит от производителя). Обычно на этом экране есть информация с указанием тех клавиш, которые необходимо нажать.
- В BIOS найдите раздел Advanced Clock Calibration и выберите параметры All Cores.
- Сохраните все настройки, нажав на F10 и Y (или используйте подсказки самого BIOS).
Читайте также: