谷歌今天发布了两款可投入生产的更新版 Gemini 1.5 型号: Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。与五月份发布的原版 Gemini 1.5 型号相比,这两款新产品略有改进。
更新后的 Gemini 1.5 系列模型在 MMLU-Pro 方面提高了约 7%,在 MATH 和 HiddenMath 基准方面提高了约 20%,在视觉和代码用例方面提高了约 2-7%。此外,谷歌还改进了模型响应的整体有用性。现在,两个模型的响应风格都更加简洁。据 Google 称,更新后的模型默认输出长度比以前的模型缩短了约 5-20%。
除了模型的改进,谷歌还做出了一项重大改变: 他们正在降低 Gemini 1.5 系列模型 API 的价格。
- 输入代币降价 64%。
- 输出代币降价 52%。
- 自 2024 年 10 月 1 日起,Gemini 1.5 Pro 的增量缓存代币降价 64%,提示代币少于 128K。
谷歌正在提高速率限制,允许开发人员构建复杂的人工智能应用。1.5 Flash 的付费级速率限制从原来的 1,000 RPM 提高到 2,000 RPM,1.5 Pro 从原来的 1,000 RPM 提高到 1,000 RPM,360 RPM。谷歌还降低了新机型的延迟。开发人员可以期待输出速度提高 2 倍,延迟降低 3 倍。
在更新的 Gemini 1.5(-002 型号)中,谷歌提高了该型号遵循用户指令的能力,同时兼顾了安全性。此外,默认情况下,谷歌不会对这些新模型应用人工智能内容安全过滤器。相反,开发人员可以根据自己的需求使用过滤器。
最后,谷歌发布了名为 “Gemini-1.5-Flash-8B-Exp-0924” 的改进版双子座 1.5 模型。这个改进的实验版本在文本和多模态用例方面都有显著的性能提升。开发人员现在可以通过 Google AI Studio 和 Gemini API 使用所有这些更新的 Gemini 1.5 模型。对于大型企业和谷歌云客户,这些新更新的 Gemini 1.5 模型可在 Vertex AI 上使用。