• 微软研发“超级大脑“:Excel智商提高25.6%!


    微软研发"超级大脑":Excel智商提高25.6%!

    前言

    QQ截图20240716144419.png

    微软

    就在7月16日,一项来自微软的最新研究引发了广泛关注——SPREADSHEETLLM。这个专为Excel等电子表格应用而生的AI大脑,号称能让Excel更加智能化。据悉,它不仅性能大幅提升,词元使用量也显著降低。那么,这个"超级大脑"到底有何过人之处?它又将如何重塑我们使用Excel的方式?让我们一探究竟。

    SPREADSHEETLLM的核心创新

    QQ截图20240716144257.png

    新模型SPREADSHEETLLM

    SPREADSHEETLLM的奥秘,主要在于它的编码框架SheetCompressor。这个由结构锚点压缩、反向索引转换和数据格式感知聚合三大模块组成的框架,是其性能飞跃的关键。

    结构锚点压缩技术巧妙地识别并提取电子表格的关键结构信息,生成精简版的"骨架"表格,大幅减少了需处理的数据量。反向索引转换则采用优化的JSON格式,将具有相同文本的单元格地址合并,显著提高了词元利用率。而数据格式感知聚合通过提取并聚类具有相似格式的数值单元格,简化了模型对数据分布的理解。

    SPREADSHEETLLM的性能提升

    得益于这些创新,SPREADSHEETLLM在各项指标上都交出了亮眼的成绩单。实验显示,它将电子表格问答的准确率提高了22%,整体性能较普通方法高出25.6%。更令人惊喜的是,它仅用了4%的词元就达成了如此表现,这意味着模型可以更高效地理解和处理复杂的电子表格。

    在GPT-4的情境学习设置中,SPREADSHEETLLM同样表现出色。微调后的模型在电子表格表格检测和问答任务上的F1值和准确度,分别提高了79%和6%,充分证明了其强大的泛化能力。

    SPREADSHEETLLM的工作原理

    QQ截图20240716144314.png

    SPREADSHEETLLM框架图

    首先,SheetCompressor的三大模块各司其职,通力合作。结构锚点压缩负责提纯表格的关键结构;反向索引转换优化词元使用;数据格式感知聚合简化数值数据的理解。它们环环相扣,逐步提炼并优化电子表格的表示。

    数据在这个流程中的演变颇为有趣。原始的杂乱无章的电子表格,经过一系列"修剪"和"打包",最终呈现为简洁明了的形式,方便SPREADSHEETLLM高效地"理解"和处理。

    值得一提的是,微软还提出了Chain of Spreadsheet(CoS)框架,以拓展SPREADSHEETLLM的应用场景。它先识别与任务查询相关的表格内容,再分解任务生成准确回答。实验表明,CoS大大提高了复杂电子表格的处理效率和回答的精准度。

    总结

    SPREADSHEETLLM的创新编码框架和出色的性能表现,为Excel带来了更加强大的系统,能更好的协助用户快速办公,在技术方面来说可谓是大突破。

    厚德云是一款专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

  • 相关阅读:
    vue3 antd table表格的增删改查(一)input输入框根据关键字搜索【后台管理系统纯前端filter过滤】
    行为型模式-命令模式
    2023 | github无法访问或速度慢的问题解决方案
    两个有序表的合并(三种方法)
    C++——指针、右左法则、指针和函数的关系、函数指针、函数转移表(函数指针static)
    Axure设计美观友好的后台框架页
    一个函数如何实现return好几个返回值(借鉴学习前辈的文章,链接放文章里了)
    关于微前端,你理解到究极奥义了么?
    SpringBoot集成monogoDB
    【java爬虫】爬虫获取某交易所公司半年报全量数据
  • 原文地址:https://blog.csdn.net/holdcloud/article/details/140466428