微软发布SpreadsheetLLM,能大福提升ai在 Excel的能力,
研究人员称,SpreadsheetLLM 的潜在应用非常广泛,从自动执行日常数据分析任务,到提供基于电子表格数据的智能见解和建议。例如,SpreadsheetLLM 可用于自动生成财务报告、识别数据中的异常或趋势、为客户提供个性化的产品或服务推荐等。
因此,SpreadsheetLLM 有可能彻底改变企业处理数据的方式。
一位用户声称:“正如我们所知,能够编写 SQL 的 LLM 将扼杀整个数据工程行业。”
另一位写道,“SaaS陷入了深深的麻烦。”
“这对金融界来说将产生巨大影响”
宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克(Ethan Mollick)在推特上写道:“这再次表明 LLM 很快就能处理结构化和非结构化电子表格数据。这将解锁许多用例(预测、财务、估值等),并且拥有电子表格真实来源往往会减少幻觉。”
SpreadsheetLLM如何工作?SpreadsheetLLM通过将电子表格数据编码为大型语言模型(LLM)可以理解的格式,从而使LLM能够对电子表格数据进行推理、回答有关数据的问题,甚至根据自然语言提示生成新的电子表格。
SpreadsheetLLM的核心是“SheetCompressor”框架,该框架可以有效地压缩和编码电子表格数据,使其更易于LLM处理。SheetCompressor由三个模块组成:
▲基于结构锚点的压缩:在整个电子表格中放置“结构锚点”,以帮助LLM理解数据结构。
▲逆索引翻译:将电子表格转换为更紧凑的格式,并消除冗余数据。
▲数据格式感知聚合:根据数字格式和数据类型对相邻单元格进行分组。
SHEETCOMPRESSOR 框架的插图(图片:Microsoft)
Microsoft称,SpreadsheetLLM显着提高了电子表格检测任务的性能,在 GPT4 的上下文学习设置中比普通方法高出 25.6%,使用词元(token)的成本降低了 96%,并能提供更好的处理结果。
目前,Microsoft还没有公布何时向公众发布SpreadsheetLLM 的消息。该论文指出,该模型仍有一些限制,如对于复杂或结构化程度高的数据,其理解能力仍然有限;SheetCompressor目前还不能压缩包含自然语言的单元格等等。
本文来自华尔街见闻,欢迎下载APP查看更多
微软发布SpreadsheetLLM,能大福提升ai在 Excel的能力,