一份全新的英特尔第五代至强 "Emerald Rapids" 幻灯片让我们对下一代数据中心 CPU 的芯片布局和性能有了更多了解。
官方幻灯片显示,英特尔第五代至强 "Emerald Rapids" CPU比第四代至强 "Sapphire Rapids" CPU快40%。
这些幻灯片来自 @InstLatX64 发现的英特尔 "以数据为中心的处理器路线图" 演示文稿。由于缺少几个关键数据点,该演示文稿看起来还很不完整,但我们确实可以了解到代号为 "Emerald Rapids" 的第 5 代至强处理器阵容的一些额外信息。
从细节入手,我们首先看到了第五代英特尔至强 CPU 的第一张特写镜头,其中详细介绍了它的各个架构模块。Emerald Rapids CPU 基于 Raptor Cove ISA 下的 P-Core 架构。旗舰芯片至强 8592+ 拥有 64 个内核、128 个线程和 480 MB 三级缓存。如你所见,英特尔已从第四代 Sapphire Rapids 处理器的 4 层设计转变为第五代 Emerald Rapids 处理器的 2 层设计。
每个芯片组通过位于两个核心和高速缓存阵列之间的模块化芯片结构连接。每个阵列共有 35 个内核,其中每个芯片禁用 3 个内核。每个芯片组有 2 个内存控制器,支持速度高达 5600 MT/s 的 DDR5 DIMM、3 个 PCIe 控制器(共 6 个)、2 个 UPI(共 4 个)和 2 个加速器引擎(共 4 个)。据英特尔公司称,英特尔 Emerald Rapids 处理器将提供以下功能:
- 更高的性能和性能/瓦
- 通过更大的共享 L3 高速缓存增加核心数量
- 1 类、2 类和 3 类计算高速链路 (CXL)
- 更高的英特尔超级路径互连速度(UPI)
- 多达 80 个 PCIe Gen5 通道
- 英特尔加速器引擎
- 内存速度提升
第五代至强 Emerald Rapids CPU 的部分功能包括:
- 高达 3 倍的 LLC 高速缓存
- 更快的内存速度
- 更多 CPU 内核数(最多 64 个内核)
- CXL 类型 3 高带宽接口
- 工作负载优化(Intel AE)
- 优化的电源模式
- 通用性能/功耗最高提升 17
- 利用英特尔加速器引擎卸载 CPU 内核,提高能效
- 大幅提升推理和训练性能
- 用于内置人工智能加速的英特尔 AMX
- 开箱即用的优化软件栈部署
第五代至强 Emerald Rapids CPU内嵌的加速器引擎提供了最新的AMX(高级矩阵扩展),并由一套利用优化开源框架和工具的可靠人工智能软件提供支持。英特尔还宣称,与第四代至强芯片相比,下一代至强芯片将提高总体拥有成本(TCO)和性能/美元收益,同时由于 CPU 与第四代 SKU 共用相同的插槽和平台,因此为客户提供了无缝升级途径。
这就引出了下一个话题,即性能。在所有基准测试中,英特尔将第五代至强铂金版 8592+ (Emerald Rapids) 64 核 CPU 与第四代至强铂金版 8480+ (Sapphire Rapids) 56 核 CPU 进行了比较。数据中心特定任务和人工智能任务的性能提升如下:
第 5 代 Xeon 8592+ 对第 4 代 Xeon 8480+ 基准测试:
- 网络(服务器端 Java 吞吐量) = +20% 增益
- 高性能计算(LAMMPS-Copper) = +30% 增益
- 媒体(FFMPEG FPS 转码) = +20% 增益
- 人工智能自然语言处理 = +40% 增益
- 人工智能推荐系统 = +40% 增益
请记住,这些都是官方基准测试结果,要想获得更清晰的图像,还需等待第三方测试结果。虽然对于新产品来说,这些性能的提升还算不错,但是否足以应对 AMD 基于 Zen 4 和 Zen 4C 架构的 EPYC 9004/8004 产品线,我们拭目以待。
AMD EPYC 系列在性能和效率方面不断刷新纪录,距离 AMD 举办的推进人工智能(Advancing AI)活动仅有一天时间,届时该公司将通过下一代加速器进一步扩展其服务器、HPC 和人工智能产品组合。与此同时,英特尔的 Emerald Rapids CPU 预计将于 12 月 14 日发布。
英特尔第 5 代 Emerald Rapids 强处理器规格 "初步":
来源:InstLatX64, Momomo_US