谷歌 AI 模型 Gemini 1.5 发布：在长文本理解方面实现突破-电脑志

谷歌宣布将通过人工智能工作室（AI Studio）发布 Gemini 1.5 Pro 进行早期测试。新模型更新的重点之一是其理解长语境内容的能力，最初支持 12.8 万 token 的语境窗口，但有望扩展到 100 万 token。

根据谷歌发布的技术论文，Gemini 1.5 Pro 的性能比 1.0 Pro 和 1.0 Ultra 都要好。与 Ultra 相比，1.5 Pro 的核心能力胜率为 54.8%，文本胜率为 77%，视觉胜率为 46%，音频胜率为 20%。与 1.0 Pro 相比，它的表现要好得多，胜率分别为 87.1%、100%、77% 和 60%。

该机型的一些亮点包括：

对海量信息进行推理

Gemini 1.5 Pro 可分析和总结阿波罗 11 号登月任务的 402 页记录。

更好地理解各种模式

Gemini 1.5 Pro 可针对不同模式执行高度复杂的推理任务，就像一部无声的巴斯特-基顿电影。

谷歌发布针对 AR 和 VR 头显的新平台 Android XR

用较长的代码块解决问题

Gemini 1.5 Pro 可对 100,000 行代码进行推理，并给出有用的解决方案、修改和解释。

谷歌首席执行官桑达尔-皮查伊这样评价新版 Gemini：

我们的团队以安全为核心，不断推动最新车型的发展。他们正在取得快速进展。事实上，我们已经准备好推出下一代产品：双子座 1.5。1.5 Pro 在多个方面都取得了巨大进步，其质量可与 1.0 Ultra 相媲美，但使用的计算量却更少。

新一代产品还在长语境理解方面实现了突破。我们已经能够显著提高模型能够处理的信息量--持续运行多达 100 万个代币，实现了大规模基础模型中最长的上下文窗口。

如果你想获得 Gemini Pro 1.5 的早期访问权限，请填写这份 Google AI Studio 表格。谷歌没有给出何时向所有用户发布这一更新的时间表，但只要完成测试就会发布。

来源：谷歌

Gallery Go v1.9.0 - 来自谷歌官方的简化版相册

本文由 King 发布在电脑志，转载此文请保持文章完整性，并请附上文章来源（电脑志）及本页链接。
原文链接：https://www.pcsofter.com/news/89601.html