AMD 的 ROCm 6.0 软件栈和完整源代码现已可供下载,并支持 Instinct MI300 和 Radeon 7000 GPU。
AMD 的 ROCm 6.0 软件栈新增了对其他人工智能库的支持,释放了 PyTorch 的 FP8 性能,增加了对 Instinct MI300 和 Radeon 7000 GPU 的支持。
在公司举办的 "推进人工智能"(Advancing AI)活动中,AMD 披露了通过 "更新" 框架增强公司 ROCm 平台的计划。
ROCm 6.0 是 AMD 试图与英伟达的 CUDA 展开激烈竞争的尝试。新的软件栈不仅升级到支持 AMD 最新的 Instinct MI300 GPU,而且还获得了强大的新功能支持,这是使其成为 CUDA 平台可行替代品的一步。
首先,ROCm 6.0 支持 AMD 的 Instinct MI300A/MIX300X AI 加速器。随着时间的推移,软件栈已经有了很大的改进,AMD 分享的 Instinct GPU 性能结果也因 ROCm 平台的改进而得到提升,尤其是在新版本中。不过,Phoronix 透露,ROCm 6.0 目前还不支持 Red Hat Enterprise Linux 9 上的新 Instinct GPU,但最终会在稍后获得支持。
ROCm 6.0 协议栈的一些主要功能包括:
- 扩展支持和访问:支持 AMD Instinct MI300A 和 MI300X
- 支持人工智能的关键功能:高度优化的注意力算法和久经考验的集体通信库
- 优化性能:PyTorch 和 hipblasLT 支持 FP8
- 帮助开发人员取得成功:可在AMD Infinity Hub上下载预打包的HPC和AI/ML框架;简化和改进的工具
- 轻松访问资源:全新改进的ROCm文档,以及AMD ROCm开发者集线器上所有其他开发者资源的新家园
接下来是更有趣的部分,ROCm 6.0 获得了对 DeepSpeed、ONNX-RT、Jax 和 CuPy 等额外库的支持,在人工智能实施方面为消费者提供了更多灵活性。此外,ROCm 6.0 现在将支持 PyTorch 和 hipblasLT 的 FP8 性能,这不仅将提供更强的性能,而且还将满足利用各自的 RDNA/CDNA 架构为人工智能工作负载做出实际贡献的需求。
AMD 官方表示,ROCm 6.0 在大型语言模型训练方面已经达到了与 CUDA 的软件平价,这表明 Team Red 已经能够缩小在以 AI 为重点的软件资源方面的差距,而这正是英伟达近年来一直占据主导地位的领域。在 Linux 中支持 ROCm 6.0 后,用户现在可以在这里下载公开的完整源代码,还可以在下面的列表中找到支持的 Radeon 7000 和 Instinct GPU 的完整列表: