码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 论文笔记--Llama3 report


    论文笔记--Llama3 report

    • 1. 文章简介
    • 2. 性能升级
    • 3. 模型升级
      • 3.1 模型架构升级
      • 3.2 数据升级
      • 3.3 指令微调
    • 4. 原文传送门
    • 6. References

    1. 文章简介

    • 标题:Llama3 Report
    • 作者:Meta
    • 日期:2024.04

    2. 性能升级

      Llama3系列本次开源了8B和70B模型,在多个benchmarks上取得了SOTA表现。具体评估细节可以参见github
    meta3-performance
      本次验证增加了高质量的人工评估集,涵盖12种场景(寻求建议、头脑风暴、分类、闭源QA、编码、创意写作、信息抽取、角色扮演、开放QA、推理、重写、摘要)共计1800个prompts。Llama3在这些prompts上表现超过GPT-3.5等模型:
    winrates

    3. 模型升级

    3.1 模型架构升级

      相比于Llama2[1],Llama3在模型架构上没有明显改变,仍采用transformer的decoder架构,模型架构升级如下

    • 词表大小由32K升级为128K
    • 采用GQA编码(Llama2也采用了GQA)
    • 上下文长度从4K增加为8k(8192)个tokens,并使用mask保证self-attention不跨文章
      model-arc

    3.2 数据升级

      相比于Llama2,Llama3的数据也进行了升级,主要升级如下

    • 总tokens数从2T增加到15T
    • 包含更多的代码
    • 包含超过5%的非英文语料
        为了保障数据质量,Llama3构建了数据清洗pipelines,包含启发式规则,NSFW(不安全内容过滤)、语义去重。此外,Meta基于Llama2的高质量内容生成能力,通过Llama2生成数据来训练文本质量分类器。

    3.3 指令微调

      Llama3采用了SFT、PPO、DPO组合的方式进行后训练(Post-training),Meta精心筛选了prompts的质量,从而大幅提高了模型表现。Meta发现模型有时候知道如何产生正确答案但不知道如何选择它,而通过PPO和DPO可提高模型的选择能力,从而提高在推理和编码任务上的表现。

    4. 原文传送门

    Meta Llama3 report
    Meta Llama3 Model

    6. References

    [1] 论文笔记–Llama 2: Open Foundation and Fine-Tuned Chat Models

  • 相关阅读:
    2022款华硕灵耀pro16和华硕proart创16区别哪个好哪个更值得入手
    云游戏| 云计算推动游戏行业进入“新纪元”
    新零售SaaS架构:线上商城系统架构设计
    Advanced .Net Debugging 6:程序集加载器
    C#设计模式详解(1)——Template Method(模板方法)
    基于java的CRM客户关系管理系统的设计与实现
    CalBioreagents ID蛋白抗体的功能和应用实例
    java计算机毕业设计ssm+vue网络考试信息网站
    ubuntu127.0.1.1
    Java版分布式微服务云开发架构 Spring Cloud+Spring Boot+Mybatis 电子招标采购系统功能清单
  • 原文地址:https://blog.csdn.net/weixin_38124427/article/details/138067020
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号