Русский
Русский
English
Статистика
Реклама

Epyc

Пора переходить в красный лагерь выбираем лучший AMD EPYC для сервера

20.08.2020 10:19:07 | Автор: admin
Сложно поверить, но последний серьезный успех AMD на рынке серверных микропроцессоров датирован далеким 2004 годом. Более 15 лет назад компания представила 64-битные Opteron, которые удачно конкурировали с интеловскими Xeon на ядрах Gallatin, обеспечивая требуемую производительность при умеренном на то время тепловом пакете. Дальнейшие годы прошли в полной доминации синих, а отсутствие прямого конкурента позволило им занять лидирующие места в большинстве сегментов рынка. Но с выходом линеек Ryzen (для настольных ПК) и EPYC (для серверных станций) AMD не просто наверстывает упущенное, а в серьез претендует на звание единоличного короля. Какие сильные стороны красных камней и что взять для создания недорогой и производительной серверной станции? Об этом и не только расскажем далее.



Летом 2017 года AMD анонсировало свое первое поколение серверных микропроцессоров EPYC, созданных на базе микроархитектуры Zen. И хоть это не принесло колоссального успеха в плане продаж (Интел все также находился в недосягаемости), но совершено точно стало новым витком развития компании. Уже тогда имеющиеся решения были прекрасны почти во всем: многоядерность и многопоточность, автоматический разгон, быстрая память, расширенные возможности для работы внешней периферии и многое другое.

Второе поколение Эпиков стало не просто логичным продолжением первой серии, но и во многом решило те немногочисленные проблемы, которые повисли с момента ее анонса. Разработчики перешли на более совершенные техпроцесс, научились компоновать ядра (стали доступны модели вплоть до 64 вычислительных блоков), предложили еще более быструю память и улучшенную PCI Express шину. А через некоторое время дополнительно подняли L3 кэш и тактовые частоты, обновив линейку под кодовым названием Rome 7Fx2. Индустриальные игроки наконец-то получили вполне конкурентоспособную альтернативу для решения широкого круга задач по оптимальной цене.

Безопасные и производительные


Процессоры для серверных станций это вычислительные локомотивы, работающие практически в круглосуточном режиме и обрабатывающие огромные массивы информации, которая, ко всему прочему, может носить конфиденциальный характер. Решаемые задачи, будь то работа с нейросетями, анализ базы данных, машинное обучение или Cloud Services требуют максимальной производительности и масштабируемости в широких пределах, имея при этом доступное аппаратное обслуживание и совокупную стоимость владения. А поэтому на первом месте здесь стоят вопросы архитектурных, технологических улучшений и информационной безопасности.

AMD EPYC это не просто высокопроизводительные чипы с множеством ядер, но и мощная программная поддержка, позволяющая им противостоять аппаратным атакам и MDS уязвимостям. Так, в сравнении с десктопными решениями Ryzen 1ХХХ-2XXX, они практически неподвержены связке уязвимостей SMM Callout и Collide + Probe и Load + Reload, способными получить контроль над UEFI-прошивкой и доступом к ОЗУ. А своевременная программная коррекция ОС и микрокода позволит с большей вероятностью оградить свое железо от нежелательного вмешательства хакеров. Вдобавок имеем улучшения по сравнению с первой версией архитектуры. Так, обновленные EPYC защищены от всех версий Spectre, больше не нуждаются в обновлении прошивки чипсета и программных инструкциях операционной системы.

Проводя параллель с синим лагерем нельзя не отметить, что против Интела было подано множество судебных исков, вызванных, как раз-таки, проблемами уязвимости процессоров. Это вынудило специалистов компании в срочном порядке искать методы снижения рисков совместно с внедрением требуемых программных коррекций. В конечном счете глобальную проблему удалось решить, о чем свидетельствуют заявление большинства крупных облачных провайдеров. Но если в части информационной безопасности Xeon еще обеспечивают должную конкуренцию, то в плане архитектуры кристаллов и грубой производительности у них все гораздо хуже.

Особенности и преимущества Эпичных процессоров


Производители компьютерной техники ежегодно выводят на рынок новое железо, стремясь не отставать от потребительской конъюнктуры и обеспечивать ГИКов передовыми разработками. Выпуск второго поколения процессоров EPYC по праву можно считать прорывом AMD в области серверного оборудования. Данные решения предлагают внушительную производительность за меньшую цену, и это без упоминания совершенно иного уровня издержек на общее владение. Не удивительно, что индустрия на ура встретила новое поколение красных чипов, а программную поддержку им оказали такие ИТ гиганты, как: Амазон, Майкрософт. Это позволило быстрыми темпами продвинуть EPYC в широкие массы, не смотря на консервативные взгляды рынка серверного оборудования.

Целесообразность выбора решений от AMD становится очевидной, когда рассматриваешь их преимущества. Среди основных, которые смогли реализовать разработчики:

  • Новый 7-нм техпроцесс и микроархитектурные улучшения (конкурент тем временем ежегодно ставит новые плюсики рядом со своей устаревшей 14-нм литографией);
  • Чиплетная компоновка, позволяющая существенно уменьшить себестоимость многоядерных процессоров;
  • Широкий ассортимент выбора, вплоть до моделей с 64 ядрами (128 потоков);
  • Реализация новой PCIe шины версии 4.0 с существенно возросшей пропускной способностью;
  • Активно развивающаяся экосистема и поддержка со стороны индустрии (партнерами выступают как производители аппаратной части, так и программного обеспечения).

А теперь подробнее.

Меньше значит лучше


Отсутствие реальной конкуренции сыграло с Интелом злую шутку. Архитектура их чипов не менялась, по сути, уже 7 лет, и мы ежегодно встречаем обновленные Sandy Bridge, просто с несколько более высокими тактовыми частотами. Прирост в 5-10% производительности совсем не тянет на инновации, особенно, когда с выходом новых чипов приходится покупать новую материнскую плату.

Но не будем о грустном: благодаря реализации передовых технических решений, AMD смогла первой представить процессоры на базе 7 нм техпроцесса (речь о х86 конечно же, мобильные Apple A12 и Snapdragon 855 тут не в счет). Что это дает? Если кратко возможность разместить больше транзисторов на единице площади. Отсюда получаем большее количество операций (лучшую производительность) при меньшем нагреве и выход годных кристаллов на уровне 90%.

Архитектурные улучшения повлияли и на связь с оперативной памятью. EPYC второго поколения с коробки поддерживают стандарт DDR4-3200 МГц (Интелы работают с 2933 МГц), а энтузиасты могут легко разогнать ее, просто изменив напряжение и профиль в БИОСе.

В рамках этого пункта нельзя не отметить работу над одним из наиболее слабых мест микроархитектуры Zen 1-ого поколения, а именно слабый показатель операций на такт. В Zen 2 избавились от этого недостатка, обеспечив новым ядрам почти 15 процентный выигрыш в скорости вычислений при тех же тактовых частотах. А для многопоточной производительности, выполнение типичных серверных операций стало быстрее на 23% (не забываем про удвоенное количество ядер и возросшей частоте). И все это укладывается в заявленный теплопакет, достигающий 250 Ватт у старших моделей.

Инновационная компоновка


Использование чиплетной компоновки для создания процессоров один из главных аргументов в пользу AMD перед извечным конкурентом. Чиплеты представляют собой отдельные кристаллы, которые связаны между собой через быструю шину данных. Обновленное поколение микроархитектуры AMD Infinity оптимизировано специально под многоядерные вычисления, кроме исполнительных блоков здесь также добавлен центральный чиплет со всеми необходимыми контроллерами, отвечающий за ввод и вывод данных. Соединение исполнительных блоков к центральному хабу обеспечивают теперь высокоскоростные дорожки Infinity Fabric. На выходе получаем, что флагманский Эпик 7742 имеет 8 чиплетов, на которых размещены 64 аппаратных ядра с возможностью обработки 128 потоков одновременно. Все это приправлено внушительными 256 Мб быстрого кэша третьего уровня. А единственным слабым звеном архитектуры по-прежнему является скорость доступа к оперативной памяти (латентность). Причем Zen 2 немного уступает даже своему предшественнику в лице первых EPYC.

Ещё несколько важных плюсов


Обновленные процессоры имеют в своем активе по 128 дорожек шины PCIe 4.0. Изменилась не только цифра в названии, но и реальная скорость передачи информации, которая в пике может достигать рекордных пол терабайта в секунду. Правда на двухсокетные материнские платы удвоение количества линий не распространяется. Половину отнимает связующая их шина Infinity Fabric. Зато разбиение процессорных линий на 8 групп по 16 штук обеспечивает им одновременную поддержку до 32 твердотельных накопителей, подключающихся по интерфейсам SATA или NVMe.


Внедрение нового стандарта PCIe, скорее всего, пройдет незамеченным для потребителей десктопного железа, а вот владельцам серверных станций это сулит вполне реальные преимущества. К примеру, шина увеличивает скорость работы твердотельных накопителей в два раза, линейно масштабируясь на операции чтения и записи файлов. Также это возможность с большей скоростью передавать данные по сети или улучшить связь с графическими и тензорными акселераторами при обслуживании нейросетей.

Немаловажным плюсом являются расширенные возможности шифрования ОЗУ, в частности АЕS-128, и улучшенная программная виртуализация. Для этого разработчикам пришлось вшить в чип отдельный 32-битный контроллер AMD Secure Processor для расширения криптографической функциональности. Что интересно, столь внушительные возможности второго поколения EPYC, вполне вероятно являются следствием работы над внешними проектами: игровыми консолями от Майкрософт и Сони. Так как заказчики настояли на программной изоляции своих продуктов с защитой от взлома аппаратными методами шифрования.

Каждому серверу по потребностям


Архитектура, техпроцесс и шины, это, конечно хорошо, но для конечного потребителя нужна конкретика. Основное, что отличает серверные процессоры AMD друг от друга это различие в количестве ядер, остальное уже как следствие, от первой производной. Здесь есть где разгуляться, доступно 14 моделей на все случаи жизни:

  • 8 ядер/16 потоков EPYC 7252(7262);
  • 12 ядер /24 потоков EPYC 7272;
  • 16 ядер /32 потоков EPYC 7282 (7302);
  • 24 ядер /48 потоков EPYC 7352 (7402);
  • 32 ядер /64 потоков EPYC 7452 (7502, 7452);
  • 48 ядер /96 потоков EPYC 7552 (7642);
  • 64 ядер /128 потоков EPYC 7702 (7742).

К вышеупомянутому списку справедливо также будет добавить процессоры EPYC линейки Rome 7Fx2. По сути, это та же архитектура, из которой разработчики смогли выжать еще дополнительные 500 МГц на ядро и добавили кэша. Получилось вполне убедительно, по заявлениям самих AMD это процессоры с лучшей производительностью на ядро, представленные на рынке. Правда количество этих самых ядер ограничено тремя моделями: с 8, 16 и 24. Сразу отметим, что подобного рода камушки отлично подойдут для дата-центров и работы с базами данных.

Стоимость чипов AMD EPYC варьируется в пределах 450 6900 долларов, в зависимости от модели. Сборка систем с 64 ядрами обеспечит нужный уровень производительности для большинства облачных сервисов, а если и этого мало ставим системы из двух сокетов. Трудно представить задачи, которые вызовут проблемы у 128 ядер и 256 потоков, работающих одновременно.

Остальные параметры, влияющие на производительность процессора, меняются линейно с увеличением количества физических ядер. Каждый чиплет содержит 32 Мб кэша верхнего уровня и 4 Мб кэша L2. Однопроцессорные модификации (имеют литеру Р в названии) ничем не ограничены в сравнении с двухпроцессорными братьями, также могут иметь от 8 до 64 ядер и верхний кэш вплоть до 256 Мб.

Сравниваем и выбираем лучшее


Презентуя серверные решения на обновленной архитектуре, в компании сделали упор на прямые сравнения вычислительной мощности и соотношении цена/производительность с конкурентами. Так, в паре топовых решений EPYC 7742 от АМД и Интеловского Ксеон 8280L, детище красного лагеря имеет практически двухкратное преимущество. Более того, младшие 32-ядерники также ничем не отстают, показывая сходную, а местами и лучшую производительность чем у флагманских чипов конкурента. В итоге получаем ситуацию, в которой сервер с одним сокетом на EPYC будет не хуже топового двухсокетного сервера на Интел. Для потребителя это меньший расход электроэнергии, экономия на лицензии, а значит и общей стоимости владения серверным оборудованием.

Другим примером сравнения может послужить народный 8-ми ядерный Ксеон Silver 4215 с ценником в 800-900 долларов против EPYC 7282 с вдвое большим количеством ядер. Последний имеет более низкую стоимость, но и при таких раскладах обеспечивает существенно лучшую производительность. А если взять в сравнение модели 7Fx2, то разница в скорости выполнения операций становится просто колоссальной, что в очередной раз доказывает преимущество 7-нм техпроцесса и улучшенной архитектуры.

Еще одной интересной для потребителя конкурирующей нишей являются решения на базе процессоров EPYC 7452 и Ксеон 6226. Да, тут стоимость не в пользу AMD, но соотношение цена/производительность снова на стороне EPYC. Если рассматривать оптимальный вариант для покупки серверной машины в офис, то стоит обратить внимание на 32-ух ядерный EPYC 7502. Здесь собрано комбо из высокой производительности и относительно доступной цены. По сути, его можно назвать золотой серединой, которая подойдет для большинства потребителей.

И напоследок


Выход AMD EPYC серьезно пошатнули, казавшиеся незыблемыми в течении 15 лет, позиции Xeonов в сегменте серверных процессоров. А усовершенствованная архитектура Zen 2 лишь усилила взятый вектор красных на монополизацию рынка. Впоследствии это заставило многих индустриальных игроков вполне серьезно задуматься о перспективах покупки чипов, выполненных по 7-нм техпроцессу. В виду того, что решениям от Интел буквально нечем ответить, AMD выбрало оптимальное время для своего триумфального возвращения на трон короля микропроцессорной техники.

Рядовому потребителю и владельцам крупных ИТ инфраструктур представлены варианты на любой бюджет и уровень производительности. Причем в каждом сегменте EPYC смотрится предпочтительнее своего конкурента. Процессоры AMD предлагают достойную аппаратную защиту, развитую экосистему, высокую скорость работы, экономию на покупке лицензии и совокупной стоимости владения оборудованием. Преимуществ большинству и так будет достаточно, а перспективы освоения 5-нанометрового производства лишь усиливают интерес к продуктам компании со стороны потенциальных потребителей.

Мы уже оценили все преимущества процессоров AMD EPYC и запустили эпичные серверы. Поспешите попробовать и вы!



Подробнее..

Перевод Бешеный рендер в 64 ядра AMD Threadripper Pro 3995WX

08.03.2021 18:14:03 | Автор: admin

Когда AMD начала предлагать процессоры Threadripper с большим количеством ядер, единственным рынком, который потреблял столько, сколько производила AMD, был рынок графического дизайна компании, которые занимались визуальными эффектами и рендерингом; им понравились количество ядер, поддержка памяти, полосы PCIe и цена. Но если есть что-то ещё, повышающее производительность, то это само стремление к производительности Threadripper Pro.


Брррр вот во что превращается вычислительная графика

Есть ряд отраслей, о которых энтузиаст, глядя со стороны, может предположить, что CPU, вероятно, устарел в смысле применения в этих отраслях. Возникает вопрос, почему отрасль не перешла полностью на GPU?

Одна из основных причин машинное обучение. Несмотря на переход к выделенному оборудованию в этой отрасли и то, что многие крупные компании используют машинное обучение на GPU, большая часть машинного обучения сегодня по-прежнему выполняется на CPU. То же самое происходит с графикой и визуальными эффектами. Причина кроется в используемых программных пакетах и в самих программистах.

Разработка ПО для CPU проста, потому что именно ей обучают большинство людей. Пакеты оптимизации для CPU хорошо зарекомендовали себя, и они даже могут быть разработаны в имитационных средах, чтобы проводить инструктажи специалистов. CPU спроектирован, чтобы обрабатывать даже очень плохой код и вообще всё, что ему подают.

Вычисления на GPU, напротив, сложнее. Они не так сложны, как раньше, поскольку существует масса библиотек, которые позволяют компилировать для GPU, не зная слишком многого о компиляции, однако сложность заключается в архитектуре рабочей нагрузки, которая могла бы взять от GPU то, что он может предложить. GPU это массивный движок, который выполняет одну и ту же операцию с помощью сотен параллельных потоков одновременно у него также очень маленький кеш, операция доступа к памяти занимает много времени, а задержка скрывается за счёт того, что одновременно выполняется очень много потоков.

Если вычислительная часть программного обеспечения не подвержена такой нагрузке, например, эта часть структурно более линейна, то потратить полгода на его переработку для GPU это напрасная трата сил. Или даже если математика лучше работает на GPU, попытки перестроить 20-летнюю (или ещё более старую) кодовую базу для GPU всё равно требуют значительных усилий со стороны группы экспертов.

Вычисления на GPU идут в гору с тех пор, как я выполнял их в конце двухтысячных годов. Но факт остается фактом: всё ещё существует ряд отраслей, представляющих смесь производительности CPU и GPU. К ним относятся машинное обучение, нефтегазовая отрасль, финансы, медицина, и та сфера, на которой мы сегодня сосредоточимся, визуальные эффекты.

Проектирование и рендеринг визуальных эффектов это сложное сочетание специализированных программных платформ и плагинов. ПО, подобное Cinema4D, Blender, Maya и другие программы полагаются на GPU для показа частично отрисованной сцены, чтобы художники работали в режиме реального времени, также полагаясь на мощь одноядерной производительности, но большая часть вычислений для финального рендеринга будет зависеть от того, какие плагины используются для конкретного продукта.

Некоторые плагины имеют ускорение GPU, например Blender Cycles, и переход на ещё более ускоренную GPU рабочую нагрузку занимает некоторое время например. область, привлекающая большое внимание GPU, дизайн с ускоренной трассировкой лучей.

Всегда возникает вопрос о том, какой метод создаёт лучшее изображение: нет смысла использовать GPU, чтобы ускорить рендеринг, если процессор добавляет шум или портит изображение.

Скорее всего, киностудия предпочтёт медленный рендеринг более высокого качества на CPU, чем быстрый и шумный на GPU, или же, наоборот, рендеринг изображения в более низком разрешении, а затем и рендеринг более высокого класса с искусственным интеллектом.

Поставляющие продукцию для отрасли OEM-производители сообщили нам, что ряд студий прямо скажут: рендеринг их рабочего процесса на CPU единственный способ рендеринга. Другой аспект память: соответствующий задаче CPU может иметь от 256 ГБ до 4 ТБ DRAM, тогда как лучшие GPU имеют пропускную способность в 80 ГБ (и это очень дорогие графические процессоры).

Вот о чём я говорю: VFX-студии до сих пор предпочитают вычисления на CPU, и, чем таких вычислений больше, тем лучше. Когда компания AMD выпустила новые процессоры на базе Zen, в частности 32- и 64-ядерные модели, их сразу же резервировали как потенциальную замену Xeon, с которыми работали студии VFX.

В компонентах AMD внимание уделяется вычислениям FP ключевому элементу в дизайне VFX. С двумя ядрами на сокет в сочетании с большим количеством кеша на одно ядро, процессор AMD был лучшим в деле. Это означает, что, хотя первые многоядерные вычислительные компоненты обладали неоднородной архитектурой памяти, это не было большой проблемой, как в случае с некоторыми другими вычислительными процессами.

Ряд компаний VFX, насколько мы понимаем, сосредоточились на платформе AMD Threadripper поверх соответствующего EPYC. Когда оба компонента впервые появились на рынке, VFX-студиям было очень легко инвестировать в рабочие станции, построенные на базе Threadripper, тогда как EPYC больше предназначался для серверной стойки.

Посмотрим на Threadripper 3000 и EPYC 7002: есть 64 ядра, 64 полосы PCIe 4.0 и большой выбор. студии VFX тогда всё ещё предпочитали Threadripper в основном из-за того, что эти процессоры предлагали лучшую мощность в 280 Вт в чём-то, что могло бы легко прийти от системных интеграторов, таких как Armari. Эти интеграторы специализируются на high-desk и high-compute, они также запрашивали у AMD большего.

Сегодня компания AMD развернула платформу Threadripper Pro, удовлетворяющую некоторым из требований выше. Тогда как VFX всегда ориентирован на вычисления в ядре, TR Pro предоставляет удвоенную полосу PCIe, удвоенную пропускную способность памяти, поддержку до 2 ТБ памяти, а также поддержку от администратора-профессионала.

Линии PCIe могут быть расширены до локального хранилища (которое всегда важно в VFX), а также больших RAM-дисков; поддержка администратора через DASH помогает поддерживать управление системами компании. AMD Memory Guard также входит в линейку Pro, которая создана, чтобы обеспечивать полное шифрование памяти.

Помимо работы с VFX компания AMD мировой лидер в области вычислений с помощью TR Pro в проектировании продуктов с помощью Creo, 3D-визуализации через KeyShot, в области проектирования архитектурных моделей с помощью ПО Autodesk Revit, а также в областях Data Science, таких как анализ массивов данных о нефти и газе, где наборы данных возрастают до сотен гигабайт и требуют существенной вычислительной поддержки.

Threadripper Pro против Workstation EPYC (WEPYC)

Глядя на преимущества, которые дают эти новые процессоры, становится ясно, что они скорее компоненты EPYC в стиле рабочей станции, чем "усовершенствованные" драйверы Threadripper. Вот объясняющая таблица:

Чтобы получить (начиная с EPYC) эти новые компоненты, всё, что AMD нужно было сделать, это поднять TDP до 280 Вт и урезать поддержку DRAM. Если начинать с базового Threadripper, есть 34 существенных изменения. Так почему же название по-прежнему Threadripper Pro, а не Workstation EPYC?

Чтобы ответить на этот вопрос, снова вернёмся в студии VFX. Когда они уже купились на брендинг и образ мысли Threadripper, сохранить название компонентов Threadripper значит, помочь сгладить переход. Как было сказано, они предпочитают Threadripper, а не EPYC (из того, что сказали нам), и поэтому сохранение названия означает, что не нужно никого переучивать.

Кроме того, линия процессора EPYC несколько изломана: есть стандартные версии, высокопроизводительные модели H, высокочастотные модели F и серия заказных конструкций под B, V, другие серии для конкретных клиентов. Сохраняя название Threadripper Pro, AMD сохраняет всё под одним началом.

Предложения Threadripper Pro: от 12 до 64 ядер

В середине прошлого года AMD анонсировала эти процессоры, а также Lenovo Thinkstation P620 как платформу их запуска. По моему опыту, линейка Thinkstation очень хорошо спроектирована, и сегодня мы тестируем наш 3995WX в P620.

TR Pro анонсировали вместе с Lenovo, и мы не были уверены, что Threadripper станет доступен какому-то другому OEM-производителю. Мы спросили об этом самих OEM-производителей в том же году, ещё до того, как узнали, существует ли TR Pro на самом деле; они заявили, что AMD даже не отметил платформу в своём плане развития, о котором мы тогда рассказывали.

С тех пор мы узнали, что у Lenovo был эксклюзивный срок в полгода; информацию предоставили другим производителям (ASUS, GIGABYTE, Supermicro) только после того, как было объявлено об этом.

В связи с этим AMD объявила, что Threadripper Pro выходит на рынок розничной торговли как для других OEM-производителей, которые будут проектировать системы, так и для конечных пользователей, которые будут собирать свои системы.

Несмотря на использование того же сокета LGA4094, что и у другие процессоров Threadripper и EPYC, TR Pro заблокируют на материнских платах WRX80. На данный момент нам известно о трёх моделях, например Supermicro и GIGABYTE, и об ASUS Pro WS WRX80E-SAGE SE Wi-Fi, которая у нас была, однако мы не смогли её протестировать.

Из четырёх перечисленных выше процессоров три лучших идут в продажу. Стоит отметить, что только 64-ядерный процессор поставляется с 256 МБ кеша L3, тогда как 32-ядерный поставляется с 128 МБ L3.

AMD придерживается такой архитектуры, что в этих чиплетах (chiplet) используется только абсолютно необходимое количество наборов микросхем, кеш L3 на одно ядро, а также 8 ядер на набор микросхем (в линейке продуктов EPYC дело обстоит немного иначе). Четвёртый процессор, 12-ядерный, по-видимому, является специфическим процессором, он создан только для OEM-производителей готовых систем.

Threadripper Pro против всех

Эти предложения Threadripper Pro созданы конкурировать с двумя сегментами рынка: во-первых, с самой AMD, демонстрирующий высокую производительность всем пользователям профессиональных систем высокого класса, построенных на аппаратном обеспечении первого поколения Zen.

Второе предложение нацелено на пользователей рабочих станций Intel с односокетным Xeon W (который имеет 28 ядер) либо на пользователей двухсокетной системы Xeon, которая дороже или которая потребляет намного больше энергии просто потому, что она двухсокетная, но при этом архитектура памяти системы неоднородная.

У нас есть почти все системы (нет 7702P, но есть 7742), и на самом деле это единственные процессоры, которые следует учитывать, если 3995WX в вашем случае один из вариантов:

Intel достигает максимума на 28 ядрах, и обойти его невозможно. Технически у Intel есть линейка процессоров AP до 56 ядер, однако это для специализированных систем, а для тестирования нам не отправили ни одного процессора этой линейки. Кроме того, это $ 20 000+ на один процессор, а также два процессора в одной системе, которые прикрепили болтами в одной упаковке.

Лучшее оборудование AMD это Threadripper, лучший доступный процессор EPYC версий 2P. Самым лучшим здесь был бы 7702P, вариант с одним сокетом и по гораздо более конкурентоспособной цене, однако у нас для целей тестирования его нет; вместо него у нас есть AMD EPYC 7742 версия с двумя сокетами, но с несколько большей производительностью.

Мы должны поблагодарить следующие компании за то, что они любезно предоставили оборудование для наших многочисленных испытательных стендов. Кое-какого железа на этом стенде нет, но оно используется в других тестах.

Пользователи, заинтересованные подробностями нашего текущего пакета эталонных тестов CPU, могут обратиться к нашей статье #CPUOverload, которая охватывает темы автоматизации эталонных тестов, а также рассказывает о том, что работает с нашим пакетом и почему.

Мы также сравниваем гораздо больше показателей, чем показано в типовом обзоре, все показатели вы можете увидеть в нашей базе данных эталонов. Мы называем эту базу Bench, также в верхней части [в оригинальном обзоре на английском языке] есть ссылка на случай, если база понадобится вам. чтобы сравнить какие-то процессоры позже.

Узнайте подробности, как получить Level Up по навыкам и зарплате или востребованную профессию с нуля, пройдя онлайн-курсы SkillFactory со скидкой 40% и промокодомHABR, который даст еще +10% скидки на обучение.

Другие профессии и курсы
Подробнее..

AMD EPYC GENOA на архитектуре Zen 4 уже в 2022 году и слухи про SMT4

16.11.2020 14:12:10 | Автор: admin
Только-только компания AMD анонсировала пользовательские процессоры линейки Ryzen на своей новой архитектуре Zen 3 и еще готовит соответствующие серверные анонсы, как в сети появилась информация уже о следующем поколении серверных процессоров компании AMD EPYC GENOA на Zen 4.



Речь идет не только о процессорах с комплектацией до 96 ядер, но и о сокетах нового поколения AM5, TR5 (HEDT-платформа), а также SP5 и SP6 (серверная платформа). Также говорится о поддержке PCI-Express 5.0 и памяти DDR5. Пока информация циркулирует в сети на уровне слухов, но учитывая то, как развивается потребительский сегмент AMD, их попытка отвоевать позиции на серверном рынке вопрос времени. Так, EPYC MILAN на Zen 3, согласно инсайдерской информации, будет минимум на 20% производительнее предыдущего поколения процессоров AMD архитектуры Zen 2 ROME.

Возможный путь к лидерству AMD это увеличение числа потоков на ядро. Это момент, который может переломить тренды на серверном рынке. Именно поэтому активно ходят разговоры о внедрении компанией AMD в свои серверные процессоры поколения Zen 4 технологии SMT4. Речь идет об одновременной обработке четырех потоков, вместо ставших стандартом двух потоков на ядро. Стоит отметить, что в процессорах EPYC MILAN технологии SMT4 почти гарантированно не будет.

Если говорить о сокетах, то из слухов становится понятно, что AMD выжала из платформы AM4 все, что смогла: в этом коду компания сделала огромный подарок потребителям, не обновляя сокет под Ryzen 5xxx и обеспечив обратную совместимость новых десктопных процессоров с уже существующим сокетом. Тут можно вспомнить бесконечные изменения сокетов у Intel, коих за последние четыре года вышло как минимум три: LGA 1151, LGA 1151 v2 и LGA 1200.

В 2022 году на смену A4 придет сокет A5 и, хочется надеяться, что он проживет так же долго, как и A4. Также грядут и обновления серверных сокетов: мы перейдем с Socket SP4 и Socket SP4r2 на SP5 и SP6. Скорее всего, обе модели выйдут одновременно и будут подходить для одного и того же поколения EPYC GENOA с той же разницей, что и сокеты SP4 и SP4r2: первые предназначены для однопоточных, а вторые для двухпоточных процессоров линейки EPYC ROME. Если предположить, что AMD все же внедрит SMT4, то SP4 будет работать, соответственно, с однопоточными и двухпоточными процессорами, а SP4r2 с четырехпоточными моделями.

Но стоит вернуться к теме SMT. Нужно понимать, что в пользовательском сегменте SMT4 сомнительная фича, которая только увеличит задержки и создаст потери на ровном месте, пока процессор будет решать, на какой из потоков перебросить очередную задачу, коих различные приложения создают десятки и сотни.

Однако в случае процессорного сегмента мы имеем дело с более монолитными системами, которые, чаще всего, заточены на работу с каким-то одним тяжелым программным комплексом. Тут SMT4 может хорошо себя показать, особенно в вычислениях. При этом не не просто теоретические выкладки: SMT4 и даже SMT8 практически древняя система, которой пользовались еще двадцать лет назад. Пик развития многопоточности пришелся на начало 2010-х годов, когда у IBM еще было собственно производство серверов для бизнеса.

Вот спецификации IBM Power S822LC последнего сервера от IBM этой линейки на собственном процессоре IBM POWER8 Core 2014 года выпуска:


С полной документацией по серверу IBM можно ознакомиться вот тут (PDF)

Из таблицы видно, что у POWER8 Core была переменная многопоточность, от режима одно ядро-один поток и до режима восьми потоков на логическое ядро процессора. Официальные частоты POWER8 Core на ядро составляют от 2,5 до 5 ГГц. При этом серверы IBM на POWER8 имели еще и 16 сокетов SMP (симметричная многопроцессорная обработка) что позволяло уже тогда объединять в вычислительный кластер полтора десятка серверов.



Стоит отметить, что серверы IBM были весьма специфичным и узким решением для крупного корпоративного бизнеса и научных вычислений. Собственно, с ростом AWS и Azure, они были выдавлены из этого сегмента и IBM Power S822LC стал последним продуктом компании в этой линейке.

Нужно сказать, что сейчас практически захватившие серверный рынок процессоры от Intel линейки Xeon тоже не работают с режимом SMT4. Если мы говорим о процессорах для науки то есть о монструозных решениях по 32-72 ядер серии Phi, например, об Intel Xeon Phi Processor 7295 с 72 ядрами и стоимостью в ~6200$ на момент релиза, то мы вообще не имеем многопоточности. По официальной спецификации у этого процессора 72 ядра и 72 потока.

Более популярные Intel Xeon E работают в режиме SMT2 два потока на ядро. Это касается практически всех популярных серверных процессоров Intel, выпущенных с 2013 года, начиная с серии E5-V2. Если приводить конкретный пример два потока уже было в крайне популярной рабочей лошадке в лице процессора Intel Xeon E5-2680V2, который активно используется до сих пор.

Если прогнозы и данные инсайдеров подтвердятся, то в ближайшие пять лет нас может ожидать частичный передел серверного рынка. AMD активно развивается в десктопном направлении, сейчас начинает давить на серверный сегмент. Intel планирует анонсы серверных процессоров этой весной, но не факт, что они будут намного мощнее новых MILAN, а тем более и грядущих GENOA. Синие до сих пор испытывают значительные трудности с литографией и не могут толком опуститься ниже техпроцесса в 14 нм, кое-как запустив производство на 10 нм ноутбучных процессоров.



P.S. На правах рекламы хотим предложить специально для читателей Хабра честную скидку в 10% на любые тарифы нашего хостинга intesect.host. Скидка действует во всех дата-центрах. Предложение действительно с 16 по 22 ноября включительно.

Промокод при покупке: habr

Подробнее..

Категории

Последние комментарии

  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru