今年 5 月,OpenAI 发布了其最先进的多模态模型 GPT-4o。与 GPT-4 Turbo 相比,它速度更快、成本更低、视觉能力更强。今天,OpenAI 分享了 GPT-4o 模型的系统卡。在发布模型系统卡的同时,OpenAI 还发布了准备框架记分卡,对 GPT-4o 进行端到端安全评估,并分享了该模型的能力、局限性以及多个类别的安全评估详情。
除了对 GPT-4 和 GPT-4V 进行安全评估和缓解措施外,OpenAI 还开展了更多的安全工作,重点关注 GPT-4o 的音频功能。评估的风险包括扬声器识别、未经授权的语音生成、受版权保护内容的潜在生成、无根据推断以及不允许的内容。根据这些评估结果,OpenAI 在模型和系统层面实施了保障措施。
GPT-4o 在准备框架四个类别中的三个类别中得分较低,仅在说服方面得分中等。根据 OpenAI 的准备框架,只有得分在 "中等" 或以下的模型才能部署,只有得分在 "高" 或以下的模型才能进一步开发。
OpenAI 还与 100 多名外部红队人员合作,在向公众发布模型之前对其进行评估。红队人员将进行探索性的能力发现,评估模型带来的新的潜在风险,并对缓解措施进行压力测试。
OpenAI 团队就 GPT-4o 的系统卡撰文如下:
OpenAI 在 GPT-4o 的开发和部署过程中实施了各种安全措施和缓解措施。作为我们迭代部署流程的一部分,我们将继续根据不断变化的情况监控和更新缓解措施。
OpenAI 为其模型发布系统卡表明了其对负责任的人工智能开发的承诺,确保每个人都能安全、无障碍地使用人工智能。您可以在下面的链接下载 PDF 版本的 GPT-4o 系统卡,以作进一步参考。