码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 李宏毅生成式AI课程笔记(持续更新


    01 ChatGPT在做的事情

    image-20231010101131534


    image-20231010101455962

    02 预训练(Pre-train)

    ChatGPT

    G-Generative

    P-Pre-trained

    T-Transformer

    GPT3 ----> InstructGPT(经过预训练的GPT3)

    生成式学习的两种策略

    我们在使用ChatGPT的时候会注意到,网站上的回答几乎是一个字一个字给出来的,这里就是生成式学习的两种策略:

    “逐个击破”(文字)与“一次到位”(影像)

    三种结构数据:文本(由token构成)、影像(像素点)、语音(采样频率)

    • 中文的token -----> 字
    • 英文的token -----> word piece,如unbreakable ----> un break able
    image-20231011201121635 image-20231011200609879

    Finetuning 与 Prompting

    Adapter,不修改模型本身参数,插入一个额外的模组

    image-20231014152258648

    image-20231012112312322

    image-20231014152429645

    上图包括了几种Adapter:Bitfit、Houlsby、AdapterBias、Prefix-tuning、LoRA

    思维链

    Chain of Thought(COT) Prompting

    思维链可以大大提高模型的准确率

    image-20231012154058010

    上图是在要求大语言模型按步骤输出答案和直接要求其输出答案的准确率区别。

    03 大模型+大资料

    大模型的顿悟

    在某个参数量之前,增加参数量不会提高模型的正确率,当提高参数规模到一定程度,会出现准确率突然变高的情况(如下图)

    image-20231014154255670

    同理,也只有在参数量达到一定程度的时候,思维链和微调才能起作用,如下图:

    image-20231014155242360

    模型是否知道自己在胡说八道,在参数量足够大的时候,模型才拥有这个能力,如下图:

    image-20231014155119589

    模型与资料的平衡

    足够大的时候,模型才拥有这个能力,如下图:

    [外链图片转存中…(img-MTYfwvWJ-1697377074486)]

    模型与资料的平衡

    image-20231014164316445

  • 相关阅读:
    【RuoYi-Cloud项目研究】【ruoyi-gateway模块】Spring Gatewaye和Sentinel实现网关流控
    Day07--生命周期的概念与分类
    三维电子沙盘数字沙盘M3DGIS大数据人工智能开发课程第8课
    【JAVA问题解决方案】02.Freemarker导出Excel超出上限分表解决方案
    春招java面试:spring有哪些常见的配置文件
    NDK编译脚本:Android.mk or CMakeLists.txt
    【Unity3D】资源管理
    springcloud:四、nacos介绍+启动+服务分级存储模型/集群+NacosRule负载均衡
    PyQt5报错Process finished with exit code -1073740791 (0xC0000409)
    7-云原生监控体系-PromQL-函数功能和示例
  • 原文地址:https://blog.csdn.net/m0_46369272/article/details/133848251
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号