微软研究人员专为电子表格创建了新的人工智能 LLM

微信扫一扫,分享到朋友圈

微软研究人员专为电子表格创建了新的人工智能 LLM

微软的 Copilot 生成式人工智能助手现已成为该公司许多软件应用程序的一部分。其中包括 Excel 电子表格应用程序,用户可以通过输入文本提示来帮助处理某些选项。

微软研究人员专为电子表格创建了新的人工智能 LLM插图

不过,微软的一组研究人员一直在研究一种新的人工智能大型语言模型,这种模型是专门为 Excel、谷歌 Sheets 等电子表格程序开发的。这些微软团队成员最近在 Arxiv.org 网站上发表了他们关于这个新模型的研究论文,这个模型的名字相当平淡无奇,叫做 SpreadsheetLLM(via VentureBeat)。

微软研究人员专为电子表格创建了新的人工智能 LLM插图1

研究人员在论文中指出,电子表格包括具有大量不同形式和选项的布局和格式。研究人员称,这可能会给标准人工智能 LLM 带来一些问题,因为它们在理解电子表格特定功能(如单元格地址和格式)方面存在令牌限制。

该团队表示,他们的电子表格 LLM 就是为了克服这些挑战而设计的。此外,该团队还开发了所谓的 SheetCompressor,顾名思义,它实际上是对电子表格进行压缩,以便 SpreadsheetLLM 能够更有效地使用电子表格。

论文指出:

它包括三个模块:基于结构锚的压缩、反向索引转换和数据格式感知聚合。它大大提高了电子表格表格检测任务的性能,在 GPT4 的上下文学习设置中,比 vanilla 方法高出 25.6%。

在他们的实验中,微软的研究人员能够为更大的电子表格提供更好的结果,同时将标记的成本降低了 96%。

目前还不知道微软计划何时甚至是否向公众提供 SpreadsheetLLM。论文指出,该模型仍有一些局限性,包括如果电子表格使用了任何背景颜色和边框,因为它们可能会占用过多的代币。此外,SheetCompressor 目前还不能压缩包含自然语言的单元格。论文指出:

例如,将 "中国"、"美国" 和 "法国" 等术语归类到 "国家" 等统一标签下,不仅能提高压缩率,还能加深 LLM 对数据的语义理解。

微软能否将这项研究成果转化为实际产品,我们拭目以待。

上一篇

Windows 11 Insider Dev Channel Build 26120.1252 发布 [附更新说明]

下一篇

[安卓] Microsoft SwiftKey Beta v9.10.41.20 - 支持同时听写和打字

你也可能喜欢

评论已经被关闭。

插入图片

排行榜

返回顶部