epyc服务器?三代epyc
AMD EPYC(霄龙)Genoa服务器 | 综合评测
AMD EPYC(霄龙) Genoa服务器|综合评测
随着生命科学、医药研发、数据中心、智算中心、遥感测绘等领域的不断发展,硬件基础对计算、存储、网络架构提出了更高要求。企业用户关注的点不仅在于更强算力和更高性能,还在于节能。AMD EPYC Genoa系列产品在11月11日推出,旨在满足这些需求。
在当前CPU市场,仅英伟达、AMD和英特尔三家独大。英特尔在液冷GPU服务器领域已有25年历史,拥有高达28个内核和6个DDR4通道的芯片,可扩展至4-8个插槽。而AMD在高端芯片中优势明显,核心数量领先约50%,通过加速器提供显著性能提升。
AMD EPYC Genoa改变了服务器的基础,每个插槽的性能改进达50-60%,实现3:2或2:1的整合比例。如果使用至强可扩展服务器转换到EPYC,整合潜力可达到4:1。新系列不仅带来了额外的内核,还优化了性能。
Genoa-X将打破L3缓存的1GB/插槽障碍,提供高达384MB的L3缓存或每个768P服务器高达2MB的L3缓存。Sapphire Rapids预计在2023年提供超过2GB的L3缓存,特别适用于边缘计算、HPC和云计算领域。
EPYC 9004系列基于Zen4架构,与桌面锐龙7000系列相同,但针对服务器与数据中心应用做了优化。IPC性能相比Zen3提高了约14%,在33种不同服务器负载中表现出色。微架构和缓存层次结构的改进,以及PCIe 5.0和DDR5内存的支持,提高了整体性能。
AMD EPYC(霄龙)9004系列为一个完整的SoC,包含一个IOD和最多12个CCD,每个CCD集成8颗Zen4 CPU核心和32MB三级缓存,最多支持96核心和384MB三级缓存。I/O性能方面,支持AVIC和PCIe 5.0,以及高达400Gbps的InfiBand网络。
内存支持DDR5,带来更高的频率、带宽、更低的电压与功耗、更好的电源管理、更多通道与更低延迟、更大容量和更好的校验纠错能力。EPYC 9004系列支持12个DDR5内存通道,单路最大容量达6TB(单条512GB),理论带宽可达460GB/s。
CXLL(Compute EXpress Link)用于处理器、内存扩展与加速器之间的高速互连,支持内存缓冲,提供扩展内存带宽与容量的能力。
AMD EPYC 9004系列SKU丰富,包括18个SKU,覆盖不同的内核数量和频率优化部件。在芯片性能方面,大型芯片上的单线程部分可能影响整体性能,尤其是在使用裸机容器和虚拟化工作负载扩展时。基准测试显示,随着更多内核的使用,整体性能显著提升。
在功耗方面,Genoa保持强大性能的同时,提供了优异的每瓦性能,通常在1kW-1.2kW之间测试。尽管内存通道数量增加至12个,但这也意味着在某些场景下可能感到不平衡。
EPYC 9004系列在服务器市场上的表现,尤其在高端领域,提供了强大的计算能力,但同时也关注了成本、功耗和实际物理限制。例如,在DDR5的采用方面,价格溢价约50%可能影响低端市场的接受度。
AMD EYPC 9004系列提供了全面的性能和功能性,满足了数据中心、云计算、HPC、边缘计算等领域的高性能计算需求。其与Intel的竞争,特别是在内核数量、性能和能效上,展现了AMD在服务器市场的竞争力。未来,AMD将继续推出更高性能的Genoa-X、Bergamo和Siena等系列,组成完整的产品矩阵,以应对不断变化的市场需求。
如何评价amdepyc服务器处理器
在服务器处理器领域,AMD的 EPYC系列处理器一直以来都是与 Intel龙争虎斗的核心。回顾过去,AMD的 Zen3架构在前端性能方面存在短板,尤其是针对 Verilator等前端压力巨大的负载时,性能表现远逊于 Intel的处理器,导致 5950x的性能仅相当于老旧的 Skylake世代处理器。
然而,在一年之后,随着 Zen4架构的推出,AMD有机会弥补这一不足。除了通过提高频率带来的性能提升,Zen4架构在微结构层面的改进重点落在了前端,超过一半的 IPC提升源自于前端相关的优化,包括分支预测和前端处理器部分。这使得人们对于 Zen4是否能够克服 Zen3在前端性能上的短板充满期待。
在实际测试中,Zen4架构在分支预测方面有了显著的改进。虽然 BTB(Branch Target Buffer)的容量并未出现巨大提升,但是潜在的算法改进足以弥补容量的不足。在实际测试中,8线程的 Verilator负载下,分支误预测率从 Zen3的 42.63%下降至 3.19%,这标志着前端性能的大幅提升。
考虑到频率差异,Zen4的性能已经与 Intel的 Golden Cove架构相匹配,甚至在某些测试场景下超过了后者。尽管在前端压力较大的负载下,Zen4与 Golden Cove的性能仍有细微差异,但在大多数实际应用场景中,两者之间的性能差距已经缩小到可以忽略不计的程度。
为了更深入地了解处理器的行为,我们借助 perf工具进行了进一步的分析。在 8线程的 Verilator负载下,Uop Cache miss率达到了惊人的 74%,这表明前端压力极其巨大。尽管 ICache(Instruction Cache)通过强大的预取机制保持了较高的命中率,但受限于 BTB的缺失,FDIP(Frontend Dependency Instruction Pre-fetch)的潜力未能得到充分释放。
从计数器数据来看,L1 BTB(Branch Target Buffer)与 L2 BTB之间存在有效的表项交换机制,使得 L1 BTB的命中率得以维持在较高的水平。同时,BTB的总 miss数量被有效控制,性能表现稳定,分支预测错误数量和性能下滑的趋势得到了明显改善。这表明,Zen4在 BTB算法层面取得了显著进步,减少了分支预测错误的数量,从而提高了整体性能。
然而,关于在不显著增加表项容量的前提下,如何大幅改善 BTB容量的具体微结构机制,仍需进一步研究和探索。这一改进不仅提升了前端性能,也为 AMD在服务器市场带来了巨大的竞争优势。
回顾 EPYC系列的发展历程,从初出茅庐时的磕绊与 bug频出,到 EPYC7003系列的锋芒毕露、稳据一方,再到 EPYC9004系列的近乎全面领先,形势的逆转令人感慨不已。对于 Intel和 AMD来说,这标志着市场竞争的激烈程度,也意味着用户在选择处理器时有了更多的选择和机会。
尽管 AMD在处理器性能上取得了显著进步,但从用户的角度来看,合理的定价策略也是决定市场竞争力的关键因素之一。希望 AMD能够在保持技术创新的同时,也考虑到用户成本的承受能力,为市场带来更多实惠且高性能的处理器产品。
32核Zen完美归来AMDEPYC服务器处理器7000系列详细评测
Ryzen锐龙在桌面上完美地“卷土重来”之后,AMD Zen全新架构正在相更多领域发起冲击,包括笔记本、商用和工作站,以及服务器,尤其是在阔别服务器和数据中心多年之后,AMD今天终于杀了回来,这就是全新的“EPYC”,中文名霄龙。
Ryzen、EPYC同宗同源,都基于Zen架构,两个新名字也都很有趣:Ryzen谐音类似Risen(崛起),而将字母s换成z之后,又巧妙地包含了Zen这个架构代号。EPYC则是Epic(传奇)的谐音,同样也有i、y的变换。
EPYC和消费级的Ryzen一样基于Zen新架构,但针对服务器、数据中心等高性能计算做了很对性的加强和优化设计,尤其是注重性能(业界领先的性能/超多核心内存与IO)、优化(资源平衡适合各种计算负载)、安全(行业第一个x86芯片级淑娟前)三个方面。
Zen服务器处理器命名为EPYC 7000系列,主要特性包括:14nm工艺制造、最多32个核心(64个线程)、每路支持八个DDR4内存通道、每路最多2TB内存、128条PCI-E通道、独立安全子系统、集成芯片组(SoC片上系统)、接口兼容下代产品。
EPYC处理器主打当今主流的双路服务器市场,可以提供比竞品方案更多的核心、内存带宽和IO,同时也适合单路服务器与工作站,各方面规格与性能也没有任何妥协。
EPYC 7000系列第一代是EPYC 7001系列(开发代号Naples那不勒斯),首发双路型号有九款之多,都支持八通道DDR4-2666内存(双路支持最多4TB)、128条PCI-E。
32核心64线程的有三款,旗舰型号EPYC 7601,频率2.2-3.2GHz,热设计功耗180W,次旗舰EPYC 7551频率降低到了2.0-3.0GHz,其他不变。
EPYC 7501是个特殊的“低功耗”型号,规格和EPYC 7551相同,但是热设计功耗可以调低到155/170W。
EPYC 7451/7401是两款24核心48线程,EPYC 7351/7301/7281都是16核心32线程,EPYC 7251则是唯一的8核心16线程,热设计功耗也只有120W。
Zen架构是基于CCX模块化设计,每个模块4个核心,桌面上的Ryzen使用两个CCX模块组成8核心,而服务器上的EPYC则是以8核心模块为基础,多个整合于单个芯片封装内,所以核心数都会是8的整倍数,处理器内部和外部则主要通过全新的Infinity Fabric总线进行高速互连。
针对单路系统的有三款型号EPYC 7551P/7401P/7351P,基本规格和对应的双路型是一样的。
实际性能如何?AMD给出了一些官方数据,比如说自家旗舰EPYC 7601对比对手旗舰Xeon E5-2699A v4(22核心44线程/2.4-3.6GHz、145W),双路整数、浮点性能可以分别领先多达47%、75%,内存带宽更是领先1.5倍。
和桌面上类似,EPYC的制胜法宝之一也是更高的性价比,在同等价位上可以提供比对手更多的核心与扩展、更高的性能,号称几乎每个价位上都能完胜,无论是超过4000美元还是400多美元,在双路系统上都能领先23-70%之多。