AMD 在上月底发布 RDNA 4 台式机 GPU 时,除了游戏性能的升级外,还大肆宣扬了新架构在人工智能和 ML 性能方面的巨大进步。
Neowin 在专栏中测试了 RX 9070 XT 的游戏性能。不过,由于 AMD 对其 AI 性能的提升颇为自豪,Neowin 将对其进行单独的小规模评测,看看架构改进带来了多大的提升。
在开始之前,这是 Sayan Sen(作者)和 Steven Parker 之间的一次合作。下面是测试电脑的规格:
- 冷却大师 MasterBox NR200P MAX
- 华擎 Z790 PG-ITX/TB4
- 英特尔酷睿 i7-14700K,带 Thermal Grizzly Carbonaut 散热器垫
- T-FORCE Delta RGB DDR5(2x16GB)7600MT/秒 CL36(XMP 配置文件)
- 2TB 金士顿 Fury Renegade 固态硬盘
- Windows 11 24H2(构建版 26100.3194)
7800 XT 和 9070 使用的驱动程序是 Adrenaline v24.30.31.03 / 25.3.1 RC(AMD 提供的新闻驱动程序),4070 使用的是 Geforce v572.47。
我们从 Geekbench AI 开始,在这里,新的 9070 XT 比 7800 XT 好得多。
在半精度(FP16)方面,RX 9070 XT 比 7800 XT 快近 51%,比 RTX 4070 快 18%。
单精度(FP32)的差距并不是很大,9070 XT 比 7800 XT 快 31%,与此同时,AMD 新显卡比 4070 快 24%。
UL Procyon 的人工智能文本生成是我们进行的下一个基准测试,在这个测试中,9070 XT 与 4070 和 7800 XT 相比都很有竞争力。这项测试衡量硬件在四种语言模型中的文本生成能力。
Navi 48 GPU 与 7800 XT 相比有 10-16%的优势,但与 4070 之间的差距较小。
我们还尝试了 UL Procyon 计算机视觉测试,该测试测量机器视觉推理性能。计算机视觉是指机器从图像或视频中提取和分析信息的能力。
我们选择了 FP32 精度进行测试,因为它比 FP16 更耗费资源。不幸的是,9070 XT 在我们每次尝试时都会崩溃,这表明存在兼容性问题。值得注意的是,RTX 4070 和 RX 7800 XT 在这项测试中都运行正常。
最后,我们完成了 Procyon AI 图像生成测试。我们选择了 Stable Diffusion XL FP16 进行测试,因为它是 UL 当前套件中强度最高的工作负载。
在这项测试中,RX 9070 XT 的速度比 7800 XT 快 83%,几乎赶上了 RTX 4070。GPU 的图像处理速度如下:
- RX 7800 XT:36.289 秒/图像
- RX 9070 XT:19.819 秒/图像
- RTX 4070:18.285 秒/图像
由于这是强度最大的测试,我们还注意到了 VRAM 的使用情况,与游戏中的情况一样,Radeon GPU 确实吞噬了更多的内存,几乎耗尽了全部可用容量。
使用 HWiNFO(商业授权),7800 XT 和 9070 XT 的专用 VRAM 用量分别为 15,980 MB 和 15,735 MB。英伟达 RTX 4070 则为 10,913 MB。
结束人工智能测试后,我们继续使用 Geekbench 和 Cinebench 2024 测试生产力。
在使用 OpenCL API 进行计算的 Geekbench 中,9070 XT 的性能低于 7800 XT 和 4070。
至少在 Geekbench 的测试中,OpenCL 的实现似乎存在漏洞。AMD 自己的数据显示,9070 XT 的 FP16 计算吞吐量高达 97.3 TFLOPS,而 7800 XT 的额定值为 74 TFLOPS,相差近 31.5%。
如果有任何变化,我们将在图表中更新新的分数。
Cinebench 2024 是另一项没有成功的测试,因为它没有检测到我们的 9070 XT。不过值得称赞的是,AMD 随后为我们提供了一个 Blender 补丁,可以启用 HIP(异构计算可移植接口)模式,该模式是基准测试在 Radeon GPU 上运行所必需的。由于个人原因,我们目前无法更新数据,因此我们将在本次评测上线后尽快更新数据。
总结
当我们完成对 RX 9070 XT 的游戏测试评测时,我们对 AMD 新显卡的全面表现印象深刻;因此,我们对人工智能和计算性能也抱有同样的期望。
总而言之,我们不得不说 AMD 在这方面也交出了一份满意的答卷,但与游戏部分不同的是,这并不是完美无缺的。这里有几个不兼容问题,但我们认为 AMD 可以通过驱动程序更新和/或软件更新来解决这些问题。它还赶上并击败了英伟达的上一代 GPU,这是另一个积极的方面。
除了驱动程序或软件不兼容问题外,我们对 9070 XT 唯一可以挑剔的地方就是 VRAM 容量。虽然 16GB 对于游戏来说已经足够,但对于人工智能工作负载来说,20GB 会更好。
在游戏评测中,我们给 AMD Radeon RX 9070 XT 打了 10 分(满分 10 分)。在这次人工智能和计算性能评测中,考虑到各方面因素,我们认为这款显卡的性能应该略逊一筹,尽管如此,凭借其出色的性能,我们仍然为其打出了 8 分的高分(满分 10 分)。
文/Neowin