码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • NLP 学习之:2022.10.27 阶段性文章总结和筛选


    文章目录

    • Transformer
      • 文章
      • 视频
    • BERT
    • pytorch 课程
    • 其他
    • Prompt learning
    • 文本风格迁移论文列表
    • GPT2
    • 数据集
    • 预训练模型
    • 深度学习

    Transformer

    文章

    • Transformer是如何实现机器翻译的?
    • log_softmax与softmax的区别
    • Transformer理论源码细节详解
    • Transformer 代码复现+详解
    • Transformer 中的 attention 原理
    • Attention-is-all-you-need (github)

    视频

    • 源码实现细节视频教程(非常详细)
    • 源码实现细节教程(不那么详细)

    BERT

    • huggingface 加载预训练模型
    • pytorch-bert github完整实现
    • 在自己的数据集上重新训练BERT(附代码)
    • Bert 从头预训练

    在这里插入图片描述

    • Tricks:用自己的数据对Bert模型进行增量预训练

    在这里插入图片描述

    • 超细节的BERT/Transformer知识点

    在这里插入图片描述

    • 男朋友给女朋友讲的BERT实现,两个小时很细致的代码讲解
    • 男朋友给女朋友讲 BERT 知识蒸馏
    • PDF 形式的Bert 源码分析,很长,超详细

    在这里插入图片描述

    pytorch 课程

    • 深度学习进阶——pytorch

    其他

    • 获取神经网络中不同中间层的输出(三种方法)
    • Pytorch 进行知识蒸馏
    • Hugging Face 中文预训练模型使用介绍及情感分析项目实战
    • Jieba分词词性标注以及词性说明
    • pytorch Embedding 层中的 pad_index 的作用
    • 那个屠榜的T5模型,现在可以在中文上玩玩了
    • 关键词提取方案(知乎)
    • docx 后缀文件读取

    Prompt learning

    • 很好的 prompt learning 概述

    文本风格迁移论文列表

    • github链接

    在这里插入图片描述

    GPT2

    • 中文 GPT2 预训练实战(博客)
    • minGPT (github)

    在这里插入图片描述

    • GPT2-NewsTitle

    在这里插入图片描述

    • GPT-2:结构、数据和字节对编码

    为什么 GPT2 要使用 bpe 编码的方式

    数据集

    • 中文摘要数据集汇总(介绍文章)
    • 中文摘要数据集汇总(数据集github网址)

    预训练模型

    • T5 PEGASUS (github 地址)

    在这里插入图片描述

    深度学习

    • 李宏毅 2022 深度学习教程(更新版)
    • 李沐:动手学深度学习v2 机器翻译与数据集
  • 相关阅读:
    线性代数_同济第七版
    好心情:长期服用抗抑郁药,怎么把肝损伤降到最低?
    CDB转OA
    怎么将ruoyi源代码与新业务代码分开写
    为什么会过拟合?判断依据?训练集验证集和测试集之间的关系?
    Pspice simulation with Op Amp AC circuits
    【Redis】Redis安装步骤和特性以及支持的10种数据类型(Redis专栏启动)
    SpringBoot实现读写分离
    微服务系统设计——子服务项目构建
    java8新特性(上)-Lambda表达式
  • 原文地址:https://blog.csdn.net/qq_42902997/article/details/127538132
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号