IBM 开发出一种新的光学技术,可以光速训练人工智能模型,同时节省大量能源。该公司表示,通过将其突破性技术应用于数据中心,在训练人工智能模型时所节省的能源相当于 5000 个美国家庭一年的能源使用量。
该公司解释说,虽然数据中心通过光纤电缆与外界连接,但在内部,它们仍在使用铜线。这些铜线连接着 GPU 加速器,而 GPU 加速器需要花费大量时间空闲等待其他设备的数据,同时消耗能源并增加成本。
IBM 高级副总裁兼研究总监 Dario Gil 在评论这一进展时说:
随着生成式人工智能需要更多的能源和处理能力,数据中心必须不断发展--而共同封装光学技术可以让这些数据中心面向未来。有了这一突破,未来的芯片将像光纤电缆进出数据中心一样进行通信,从而开创一个更快、更可持续的通信新时代,能够处理未来的人工智能工作负载。
IBM 在一份技术论文中概述了其新型协同封装光学(CPO)原型。通过大幅增加数据中心的带宽,可以最大限度地减少 GPU 停机时间,从而加速人工智能处理。
IBM 解释说,大型语言模型(LLM)的训练时间可以从三个月缩短到三周。同时,能效的提高将减少能源使用,降低与训练 LLM 相关的成本。
来源:IBM Newsroom