谷歌发布改进型 Gemini 1.5 系列机型,并将 API 价格降低 50%

微信扫一扫,分享到朋友圈

谷歌发布改进型 Gemini 1.5 系列机型,并将 API 价格降低 50%

谷歌今天发布了两款可投入生产的更新版 Gemini 1.5 型号: Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。与五月份发布的原版 Gemini 1.5 型号相比,这两款新产品略有改进。

更新后的 Gemini 1.5 系列模型在 MMLU-Pro 方面提高了约 7%,在 MATH 和 HiddenMath 基准方面提高了约 20%,在视觉和代码用例方面提高了约 2-7%。此外,谷歌还改进了模型响应的整体有用性。现在,两个模型的响应风格都更加简洁。据 Google 称,更新后的模型默认输出长度比以前的模型缩短了约 5-20%。

除了模型的改进,谷歌还做出了一项重大改变: 他们正在降低 Gemini 1.5 系列模型 API 的价格。

  • 输入代币降价 64%。
  • 输出代币降价 52%。
  • 自 2024 年 10 月 1 日起,Gemini 1.5 Pro 的增量缓存代币降价 64%,提示代币少于 128K。

谷歌正在提高速率限制,允许开发人员构建复杂的人工智能应用。1.5 Flash 的付费级速率限制从原来的 1,000 RPM 提高到 2,000 RPM,1.5 Pro 从原来的 1,000 RPM 提高到 1,000 RPM,360 RPM。谷歌还降低了新机型的延迟。开发人员可以期待输出速度提高 2 倍,延迟降低 3 倍。

在更新的 Gemini 1.5(-002 型号)中,谷歌提高了该型号遵循用户指令的能力,同时兼顾了安全性。此外,默认情况下,谷歌不会对这些新模型应用人工智能内容安全过滤器。相反,开发人员可以根据自己的需求使用过滤器。

最后,谷歌发布了名为 “Gemini-1.5-Flash-8B-Exp-0924” 的改进版双子座 1.5 模型。这个改进的实验版本在文本和多模态用例方面都有显著的性能提升。开发人员现在可以通过 Google AI Studio 和 Gemini API 使用所有这些更新的 Gemini 1.5 模型。对于大型企业和谷歌云客户,这些新更新的 Gemini 1.5 模型可在 Vertex AI 上使用。

上一篇

Microsoft Azure AI 内容安全增加新有害内容检测方法

下一篇

英特尔发布支持 Core Ultra Series 2 的新图形驱动程序

你也可能喜欢

评论已经被关闭。

插入图片

公众号

公众号
关注我们

排行榜

返回顶部