在短短一年多的时间里,谷歌推出了新的大型语言模型(LLM),先是以谷歌巴德(Google Bard)为名,最后定名为双子座(Gemini)。今天,在谷歌 I/O 2024 开发者大会上,该公司宣布了 Gemini 系列人工智能模型的一些新更新。
在一篇博客文章中,谷歌公布了一个全新的模型--Gemini 1.5 Flash。顾名思义,它是一个轻量级的 LLM,旨在快速工作。谷歌表示:
1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。这是因为 1.5 Pro 通过一种称为 "蒸馏 "的过程对其进行了训练,将大型模型中最基本的知识和技能转移到更小、更高效的模型中。
新机型目前只有预览版,将于 6 月份全面上市。
目前的 Gemini 1.5 Pro 型号也将得到一些更新。谷歌表示:
1.5 Pro 现在可以遵循越来越复杂和细微的指令,包括指定涉及角色、格式和风格的产品级行为的指令。我们改进了对模型针对特定用例的响应的控制,例如精心设计聊天代理的角色和响应风格,或通过多个功能调用实现工作流自动化。我们还让用户能够通过设置系统指令来引导模型行为。
Flash 和专业版都配备了 100 万个令牌上下文窗口。不过,谷歌今天还宣布正在测试专业版的 200 万个令牌上下文窗口。想试用该版本的开发者可以注册 waitlist。
谷歌今天还披露了新的 Gemma 2 开源 LLM 模型。谷歌在另一篇博文中表示,该模型将于 6 月份推出:
开发人员和研究人员要求有一个更大的模型,但尺寸仍要易于使用。新的 Gemma 27B 机型应该能满足这些要求:它的性能超过了一些比它大两倍多的机型,并能在顶点人工智能(Vertex AI)的 GPU 或单个 TPU 主机上高效运行。
最后,其用于设备上人工智能工作的 Gemini Nano 模型现在除了能理解公司 Pixel 设备上的文本提示外,还能理解视觉、声音和有声语言提示。