• 新晋“学霸”夸克大模型拿下C-Eval和CMMLU双榜第一


    11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单,多项性能优于GPT-4。在国内大模型赛道火热的当下,夸克自研大模型凭借过硬的研发能力及数据、行业、平台等优势成为新晋“学霸”。

    作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。

    b20572ef850f4d938242022b49dec13d.png 

    评测过程中,夸克大模型经过了上万道专业考题的检验,覆盖几十个学科和不同学段。无论是常识问题还是社会科学知识,夸克大模型都展现出了处理复杂、多层次问题的能力。基于精调后的训练数据,夸克大模型能够更好地理解问题的上下文、逻辑结构和语义关系,从而更全面、深入地分析和解决问题。

    在CMMLU榜单评测中,夸克大模型以平均77.08分的成绩位列总成绩第一,并占据社会科学和其他两个类目的首位。在C-Eval榜单中,夸克大模型平均分达到89分,稳居行业第一,同时在社会科学、人文科学和其他三个类目中位列榜首。夸克大模型同时登顶两大权威榜单,也进一步证明夸克在数据增强、模型选择、训练策略、模型融合以及模型评估上,处在行业领先地位。

    873d1753f95d461e88ac63875bfb4c4d.png 

    同时,在国内专业考试测试中,夸克大模型的表现堪称“学霸”。不仅在中考、高考、研究生考试中超过GPT-4,包括临床执业医师资格考试、计算机等级考试、公务员考试、教师资格证考试等评测中均优于GPT-4。具备超强解题能力的夸克大模型,应用在日常学习、工作场景,有望给用户带来效率上的全面提升。

       此外,夸克大模型还拥有强大的文学创作能力,能够根据用户提供的主题或关键词,生成连贯、有逻辑、有深度的文本内容,可以帮助用户撰写文章、新闻、诗歌等各类文本,支持续写、润色、仿写、批改等多种不同写作需求,进一步提高用户的创作效率。

       据介绍,凭借数据、行业、知识正确性、平台等四大优势,夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。夸克将借助自研大模型全面升级,为年轻人工作、学习、生活提供更全面的服务。

  • 相关阅读:
    Http代理与socks5代理有何区别?如何选择?(二)
    在Centos上配置bgp路由
    新一代音视频架构在元宇宙场景的实践
    热烈祝贺润物成功入选航天系统采购供应商库
    服务器被墙是什么原因,怎么解决服务器被墙
    vxe-table导出方法以及排坑指南
    Redis五个使用场景
    人工智能时代,掌握未来技术趋势,成为领先者
    多线程 _ 基础篇 _ 线程安全问题【JavaEE初阶】
    华为防火墙基础自学系列 | Hub Spoke IPsec VdPdNd
  • 原文地址:https://blog.csdn.net/FL63Zv9Zou86950w/article/details/134451072