在 OpenAI 的春季更新流媒体活动中,这家人工智能初创公司宣布了它的下一个大型语言模型(LLM),公司称之为 ChatGPT-4o。
在发布会上,OpenAI 的首席技术官米拉-穆拉提(Mira Murati)表示,公司希望扩大 ChatGPT-4 LLM 的覆盖范围。ChatGPT-4o 的发布将使这一目标得以实现,因为它面向所有人,甚至是免费用户。OpenAI 首席执行官山姆-阿尔特曼(Sam Altman)在 X(前 Twitter)上发表的一篇文章中证实了这一点:
在现场演示中,OpenAI 团队成员用自然的语音命令与 ChatGPT-4o 进行了聊天。只需台上的人类提出一些语音建议,人工智能语音就能改变语调,包括改变音调,使声音更有戏剧性,甚至变成类似机器人的声音。
在另一个演示中,ChatGPT-4o 通过智能手机摄像头显示了一个书面数学公式,人工智能语音能够描述这个公式以及更多内容。阿尔特曼在他的 X 账户上发布消息称,ChatGPT-4o 将在未来几周内开始推广。
在 OpenAI 博客的一篇文章中,有更多关于新 ChatGPT-4o 型号的信息:
它可以在 232 毫秒内响应音频输入,平均响应时间为 320 毫秒,这与人类在对话中的响应时间(在新窗口中打开)相似。它在英语和代码文本方面的性能与 GPT-4 Turbo 相当,在非英语语言文本方面也有显著提高,同时在应用程序接口(API)方面速度更快,价格便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
微软是 OpenAI 的主要技术投资者和合作伙伴,它经常将 OpenAI 的新模型添加到自己的人工智能服务中。截至本文撰写之时,还没有消息表明 ChatGPT-4o 将于何时被添加到微软的人工智能产品中。
OpenAI 还透露,它的 GPT Store(人们可以在这里为特定任务提供定制聊天机器人)现在可供每个 ChatGPT 用户访问。