微软正在研发一款名为SpreadsheetLLM的AI模型,旨在让Excel电子表格的使用变得更加智能且直观,用户只需使用自然语言即可进行数据查询和操作。
微软的SpreadsheetLLM框架利用先进的语言模型解析电子表格数据,专为克服传统模型处理电子表格时遇到的难题而设计,如二维网格的复杂性、多变的布局和各式各样的格式。该工具通过序列化数据、融合单元格地址与值,以及格式信息,实现了高效的数据处理。
SpreadsheetLLM由三个核心模块组成的SheetCompressor组件负责简化电子表格,剔除非表格内容,优化数据表示,并对数据进行汇总。尽管当前版本仍有局限,如忽略了单元格背景色等视觉信息,但它在测试中表现出了显著的优势,尤其在GPT-4的上下文学习场景中,性能超出传统方法25.6%。同时,它大幅度减少了数据编码所需的标记数量,降低了计算成本,并在电子表格表格检测方面表现出色。
尽管如此,SpreadsheetLLM尚未达到商用标准,仍处于研究阶段。不过,它预示着未来非技术用户可以借助自然语言提示轻松驾驭复杂数据,无需深入了解Excel的底层机制。这一进步可能会对会计、数据分析等岗位产生深远影响,促使职场技能需求的变化。
SpreadsheetLLM有望在金融、会计等领域增强工作效率,而非简单替代人类角色。它引入的“电子表格链”(CoS)框架将电子表格推理过程细分为“检测-匹配-推理”,并能处理结构化与非结构化数据,减少AI生成输出中的错误,提升分析的准确性。
不知道,人工智能AI如水银泻地无孔不入的创新是否意味着生产力的飞跃,或是工作机会的缩水......


