在本周举行的开放计算项目(OCP)全球峰会上,微软做出了几项新贡献,以优化各级基础设施,实现人工智能的突破。
其中一个重点是数据中心冷却,以支持人工智能系统的更高功率负载。微软展示了先进的液体冷却热交换器设计,以便在全球范围内更轻松地部署。该系统采用模块化设计,可高效地为处理人工智能工作负载的越来越密集的机架散热。
微软表示,电力传输是另一个需要创新的领域。它展示了微软和 Meta 如何合作开发一种分解式 400 高压直流(VDC)机架设计。模块化电源架构可将机架从数百千瓦扩展到一兆瓦,以增加每个机架的人工智能加速器,从而确保您的基础设施规模能够适应不断变化的工作负载需求。
这是一种全新的分解式机架设计,可解决关键的空间和电力限制问题。该解决方案采用分解式 400 高压直流 (VDC) 单元,功率从数百千瓦扩展到 1 兆瓦,使每个服务器机架中的人工智能加速器数量增加 15%至 35%。这种模块化方法允许在分解电源机架中进行功率调整,以满足不同推理和训练 SKU 不断变化的需求。
微软还预览了针对新一代量子攻击机器的人工智能加固措施。它正在通过 Caliptra 硅信任根项目将 Adams Bridge 抗量子加速器开源。
量子计算机日益增强的能力给硬件安全带来了挑战,因为硬件安全中普遍使用的经典非对称加密算法很容易被足够强大的量子计算机攻破。认识到这一风险后,美国国家标准与技术研究院(NIST)发布了新的量子弹性算法标准。
此外,微软还联合发起了 OCP-SAFE 计划,对硬件和固件进行统一的安全审计。除 Caliptra 等项目外,该计划还进一步提高了供应链的透明度和完整性,这对于实现硬件信任至关重要。