码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 自然语言处理 Paddle NLP - 预训练模型产业实践课-理论


    基础
    自然语言处理(NLP)
    自然语言处理PaddleNLP-词向量应用展示
    自然语言处理(NLP)-前预训练时代的自监督学习
    自然语言处理PaddleNLP-预训练语言模型及应用
    自然语言处理PaddleNLP-文本语义相似度计算(ERNIE-Gram)
    自然语言处理PaddleNLP-词法分析技术及其应用
    自然语言处理PaddleNLP-快递单信息抽取
    理解
    自然语言处理PaddleNLP-信息抽取技术及应用
    自然语言处理PaddleNLP-基于预训练模型完成实体关系抽取--实践
    自然语言处理PaddleNLP-情感分析技术及应用-理论
    自然语言处理PaddleNLP-情感分析技术及应用SKEP-实践
    问答
    自然语言处理PaddleNLP-检索式文本问答-理论
    自然语言处理PaddleNLP-结构化数据问答-理论
    翻译
    自然语言处理PaddleNLP-文本翻译技术及应用-理论
    自然语言处理PaddleNLP-机器同传技术及应用-理论
    对话
    自然语言处理PaddleNLP-任务式对话系统-理论
    自然语言处理PaddleNLP-开放域对话系统-理论
    产业实践
    自然语言处理 Paddle NLP - 预训练模型产业实践课-理论

    image
    模型压缩:理论基础
    模型压缩基本方法分为三类:

    • 量化
    • 裁剪
    • 蒸馏
      image
      量化
      image
      image
      裁剪
      image
      image
      绿线:随机裁剪 30% 已经扛不住了
      蓝线:60% 还不错
      image
      蒸馏
      image
    • 蒸馏任务与原来的学习任务同时进行.
    • 对于没有标注的数据,可以只学习teacher的预测概率
      Teacher model:教师模型,是已经训练好的,比较不错的模型。
      Student(distilled) model:学生模型,是重新初始化的小模型,去学生老师的结果
      设置损失函数,让学生的概率分布,往老师上靠。使得学生能够复现老师的输出,从而获得老师的准确率
      image

    image
    蒸馏的信号
    image

    第一步:A 首先对Student进行学习,不带蒸馏的,一般在无监督数据上进行 lask
    第二步:把学习的模型拿过来,带一个老师模型,同样进行无监督学习,B
    第三步:通过通用的老师.. 视频时间:20:00
    任务无关蒸馏:不需要知道下一步要做什么,蒸完就能直接拿去用
    image
    3层,比12层更小,更宽。
    压缩模型最好是压深度,而不是宽度,因为压缩深度可以有效的降低依赖性,使用3步就可以完成计算,宽度有些设备可以高效的并行完成
    宽度的大小对整个模型的预测时间,是影响不大的
    image
    中文是没有空格的语言,所以先要分词
    image
    产业实践案例
    模型上线,首先要考虑的是模型是不是需要微调,有些模型不需要微调,直接可以上线。

    1. 可能没有数据给他微调
    2. 希望这个模型做为下游模型的输入

    image
    CPU在线预测应用
    image
    数据增强
    image
    image

    实践案例:搜索问答

    image
    image
    实践案例:GPU在线预测应用在搜索引擎
    image

  • 相关阅读:
    一个非常实用的分布式 JVM 监控工具
    美食推荐网站设计
    基于Python实现的基金交易系统
    git基本使用
    电子标签模块:让传感器智能化,工程安全监测更便捷
    Q&A特辑 | 看了这场直播,我找到了设备指纹“从不说谎”的原因
    【开发环境】安装 Hadoop 运行环境 ( 下载 Hadoop | 解压 Hadoop | 设置 Hadoop 环境变量 | 配置 Hadoop 环境脚本 | 安装 winutils )
    HDLBits: 在线学习 SystemVerilog(六)-Problem 24-27
    路由懒加载
    计算机网络:网络层 —— IP数据报的发送和转发过程
  • 原文地址:https://www.cnblogs.com/vipsoft/p/17491191.html
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号