谷歌 AI 模型 Gemini 1.5 发布:在长文本理解方面实现突破

微信扫一扫,分享到朋友圈

谷歌 AI 模型 Gemini 1.5 发布:在长文本理解方面实现突破

谷歌宣布将通过人工智能工作室(AI Studio)发布 Gemini 1.5 Pro 进行早期测试。新模型更新的重点之一是其理解长语境内容的能力,最初支持 12.8 万 token 的语境窗口,但有望扩展到 100 万 token。

根据谷歌发布的技术论文,Gemini 1.5 Pro 的性能比 1.0 Pro 和 1.0 Ultra 都要好。与 Ultra 相比,1.5 Pro 的核心能力胜率为 54.8%,文本胜率为 77%,视觉胜率为 46%,音频胜率为 20%。与 1.0 Pro 相比,它的表现要好得多,胜率分别为 87.1%、100%、77% 和 60%。

谷歌 AI 模型 Gemini 1.5 发布:在长文本理解方面实现突破插图

该机型的一些亮点包括:

对海量信息进行推理

Gemini 1.5 Pro 可分析和总结阿波罗 11 号登月任务的 402 页记录。

更好地理解各种模式

Gemini 1.5 Pro 可针对不同模式执行高度复杂的推理任务,就像一部无声的巴斯特-基顿电影。

用较长的代码块解决问题

Gemini 1.5 Pro 可对 100,000 行代码进行推理,并给出有用的解决方案、修改和解释。

谷歌首席执行官桑达尔-皮查伊这样评价新版 Gemini:

我们的团队以安全为核心,不断推动最新车型的发展。他们正在取得快速进展。事实上,我们已经准备好推出下一代产品: 双子座 1.5。1.5 Pro 在多个方面都取得了巨大进步,其质量可与 1.0 Ultra 相媲美,但使用的计算量却更少。

新一代产品还在长语境理解方面实现了突破。我们已经能够显著提高模型能够处理的信息量--持续运行多达 100 万个代币,实现了大规模基础模型中最长的上下文窗口。

如果你想获得 Gemini Pro 1.5 的早期访问权限,请填写这份 Google AI Studio 表格。谷歌没有给出何时向所有用户发布这一更新的时间表,但只要完成测试就会发布。

来源:谷歌

上一篇

ChatGPT 制造商 OpenAI 展示文字视频人工智能模型 Sora

下一篇

微软发布包含 Moment 5 功能的全新 Windows 11 Release Preview 版本

你也可能喜欢

评论已经被关闭。

插入图片

排行榜

返回顶部