码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • NEFTUNE: NOISY EMBEDDINGS IMPROVE INSTRUCTION FINETUNING


    本文是LLM系列文章,针对《NEFTUNE: NOISY EMBEDDINGS IMPROVE INSTRUCTION FINETUNING》的翻译。

    NEFTUNE:噪声嵌入改善指令微调

    • 摘要
    • 1 引言
    • 2 NEFTUNE:噪声嵌入指令调整
    • 3 实验设置
    • 4 结果
    • 5 分析
    • 6 结论与局限性

    摘要

    我们展示了语言模型微调可以通过简单的增强来改进,有时甚至是显著的改进。NEFTune在训练期间向嵌入向量添加噪声。使用Alpaca对LLaMA-2-7B的标准微调在AlpacaEval上实现了29.79%,而使用噪声嵌入时,这一比例上升到64.69%。NEFTune还改进了现代指令数据集上的强基线。使用Evol Instruct训练的模型可以看到10%的改进,使用ShareGPT8%的改进,OpenPlatypus改进了8%。即使是用RLHF进一步改进的强大模型,如LLaMA-2-Chat,也可以从NEFTune的额外训练中受益。

    1 引言

    2 NEFTUNE:噪声嵌入指令调整

  • 相关阅读:
    udp协议下sendto与recvfrom函数对应的errno
    2022-07-20
    【前端设计模式】之工厂模式
    QT银行储蓄管理系统
    【GEE】9、在GEE中生成采样数据【随机采样】
    vue-swiper组件化:解决异步请求数据时swiper过早初始化问题:
    muduo源码剖析之TcpConnection连接管理
    Scala第十七章节
    Java Field类简介说明
    squid代理服务器
  • 原文地址:https://blog.csdn.net/c_cpp_csharp/article/details/134059637
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号