AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

微信扫一扫,分享到朋友圈

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

AMD 在上月底发布 RDNA 4 台式机 GPU 时,除了游戏性能的升级外,还大肆宣扬了新架构在人工智能和 ML 性能方面的巨大进步。

Neowin 在专栏中测试了 RX 9070 XT 的游戏性能。不过,由于 AMD 对其 AI 性能的提升颇为自豪,Neowin 将对其进行单独的小规模评测,看看架构改进带来了多大的提升。

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

在开始之前,这是 Sayan Sen(作者)和 Steven Parker 之间的一次合作。下面是测试电脑的规格:

  • 冷却大师 MasterBox NR200P MAX
  • 华擎 Z790 PG-ITX/TB4
  • 英特尔酷睿 i7-14700K,带 Thermal Grizzly Carbonaut 散热器垫
  • T-FORCE Delta RGB DDR5(2x16GB)7600MT/秒 CL36(XMP 配置文件)
  • 2TB 金士顿 Fury Renegade 固态硬盘
  • Windows 11 24H2(构建版 26100.3194)

7800 XT 和 9070 使用的驱动程序是 Adrenaline v24.30.31.03 / 25.3.1 RC(AMD 提供的新闻驱动程序),4070 使用的是 Geforce v572.47

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

我们从 Geekbench AI 开始,在这里,新的 9070 XT 比 7800 XT 好得多。

在半精度(FP16)方面,RX 9070 XT 比 7800 XT 快近 51%,比 RTX 4070 快 18%。

单精度(FP32)的差距并不是很大,9070 XT 比 7800 XT 快 31%,与此同时,AMD 新显卡比 4070 快 24%。

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

UL Procyon 的人工智能文本生成是我们进行的下一个基准测试,在这个测试中,9070 XT 与 4070 和 7800 XT 相比都很有竞争力。这项测试衡量硬件在四种语言模型中的文本生成能力。

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

Navi 48 GPU 与 7800 XT 相比有 10-16%的优势,但与 4070 之间的差距较小。

我们还尝试了 UL Procyon 计算机视觉测试,该测试测量机器视觉推理性能。计算机视觉是指机器从图像或视频中提取和分析信息的能力。

我们选择了 FP32 精度进行测试,因为它比 FP16 更耗费资源。不幸的是,9070 XT 在我们每次尝试时都会崩溃,这表明存在兼容性问题。值得注意的是,RTX 4070 和 RX 7800 XT 在这项测试中都运行正常。

最后,我们完成了 Procyon AI 图像生成测试。我们选择了 Stable Diffusion XL FP16 进行测试,因为它是 UL 当前套件中强度最高的工作负载。

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

在这项测试中,RX 9070 XT 的速度比 7800 XT 快 83%,几乎赶上了 RTX 4070。GPU 的图像处理速度如下:

  • RX 7800 XT:36.289 秒/图像
  • RX 9070 XT:19.819 秒/图像
  • RTX 4070:18.285 秒/图像

由于这是强度最大的测试,我们还注意到了 VRAM 的使用情况,与游戏中的情况一样,Radeon GPU 确实吞噬了更多的内存,几乎耗尽了全部可用容量。

使用 HWiNFO(商业授权),7800 XT 和 9070 XT 的专用 VRAM 用量分别为 15,980 MB 和 15,735 MB。英伟达 RTX 4070 则为 10,913 MB。

结束人工智能测试后,我们继续使用 Geekbench 和 Cinebench 2024 测试生产力。

在使用 OpenCL API 进行计算的 Geekbench 中,9070 XT 的性能低于 7800 XT 和 4070。

AMD RX 9070 XT AI 性能对比 7800 XT 和英伟达 RTX 4070 评测

至少在 Geekbench 的测试中,OpenCL 的实现似乎存在漏洞。AMD 自己的数据显示,9070 XT 的 FP16 计算吞吐量高达 97.3 TFLOPS,而 7800 XT 的额定值为 74 TFLOPS,相差近 31.5%。

如果有任何变化,我们将在图表中更新新的分数。

Cinebench 2024 是另一项没有成功的测试,因为它没有检测到我们的 9070 XT。不过值得称赞的是,AMD 随后为我们提供了一个 Blender 补丁,可以启用 HIP(异构计算可移植接口)模式,该模式是基准测试在 Radeon GPU 上运行所必需的。由于个人原因,我们目前无法更新数据,因此我们将在本次评测上线后尽快更新数据。

总结

当我们完成对 RX 9070 XT 的游戏测试评测时,我们对 AMD 新显卡的全面表现印象深刻;因此,我们对人工智能和计算性能也抱有同样的期望。

总而言之,我们不得不说 AMD 在这方面也交出了一份满意的答卷,但与游戏部分不同的是,这并不是完美无缺的。这里有几个不兼容问题,但我们认为 AMD 可以通过驱动程序更新和/或软件更新来解决这些问题。它还赶上并击败了英伟达的上一代 GPU,这是另一个积极的方面。

除了驱动程序或软件不兼容问题外,我们对 9070 XT 唯一可以挑剔的地方就是 VRAM 容量。虽然 16GB 对于游戏来说已经足够,但对于人工智能工作负载来说,20GB 会更好。

在游戏评测中,我们给 AMD Radeon RX 9070 XT 打了 10 分(满分 10 分)。在这次人工智能和计算性能评测中,考虑到各方面因素,我们认为这款显卡的性能应该略逊一筹,尽管如此,凭借其出色的性能,我们仍然为其打出了 8 分的高分(满分 10 分)。

文/Neowin

上一篇

英特尔酷睿 Ultra 系列处理器新增 200U、200H、200HX 和 200S 系列

下一篇

Google Chrome v134.0.6998.36 正式版

你也可能喜欢

评论已经被关闭。

插入图片

公众号

公众号
关注我们

排行榜

返回顶部