码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 2021秋招-总目录


    2021秋招-目录

    知识点总结

    1. 预训练语言模型: Bert家族
      1.1 BERT、attention、transformer理解部分
    1. B站讲解–强烈推荐
    2. 可视化
    3. 推倒
    4. 结合代码理解
    5. 代码部分
    6. 常见面试考点以及问题:
    1. word2vec 、 fasttext 、elmo;
    2. BN 、LN、CN、WN
    3. NLP中的loss与评价总结
      4.1 loss_function:
    1. 深度学习-Loss函数
    1. L1、L2正则化总结: L1,L2正则所有问题-视频-PPT截图⭐⭐⭐⭐
      5.1 知乎-L1正则化与L2正则化⭐⭐⭐
      5.2 贝叶斯眼里的正则化⭐⭐
      5.1 L1正则化与L2正则化
      5.2 深入理解L1、L2正则化
      5.3 L1和L2正则化的概率解释🎃
      5.4 机器学习中的范数规则化之(一)L0、L1与L2范数
      5.5 L1正则化和L2正则化的详细直观解释
      5.6 机器学习——正则化不理解的地方
    2. 过拟合、欠拟合 原因、现象、解决办法。
      6.1 深度学习中的过拟合问题和解决办法(转载)
      6.2

    面经

    刷题

    深度学习汇总

    0. 数学公式整理

    机器学习之常用矩阵/向量运算-待整理

    1. 矩阵乘法
    2. Hadamard product
    3. 向量点积
    4. 向量叉积
    5. CNN中点积求和
    6. 矩阵乘法中: 可以看作 向量点积;

    (转载)数学-矩阵计算 矩阵和向量的求导法则-待整理

    1. 前馈网络、反向传播公式推导

    反向传播算法(过程及公式推导)⭐⭐⭐
    反向传播算法—从四个基本公式说起

    • 神经元结构神经网络入门——神经元算法
      在这里插入图片描述
    • 神经元/数据/参数 计算; 神经元指的一个结构。
      在这里插入图片描述
      在这里插入图片描述

    2. SGD推倒

    3. 优化器总结

    4. 激活函数总结

    5. pooling、dropout、

    6. 参数 &超参数、batch_size、学习率

    6.损失函数专题

    7.过拟合、欠拟合

    8.BN、LN

    8.1 Internal Covariate Shift

    • 如何理解 Internal Covariate Shift?

    ​ 深度神经网络模型的训练为什么会很困难?其中一个重要的原因是,深度神经网络涉及到很多层的叠加,而每一层的参数更新会导致上层的输入数据分布发生变化,通过层层叠加,高层的输入分布变化会非常剧烈,这就使得高层需要不断去重新适应底层的参数更新。为了训好模型,我们需要非常谨慎地去设定学习率、初始化权重、以及尽可能细致的参数更新策略。

    ​ Google 将这一现象总结为 Internal Covariate Shift,简称 ICS。 什么是 ICS 呢?

    ​ 大家都知道在统计机器学习中的一个经典假设是“源空间(source domain)和目标空间(target domain)的数据分布(distribution)是一致的”。如果不一致,那么就出现了新的机器学习问题,如 transfer learning / domain adaptation 等。而 covariate shift 就是分布不一致假设之下的一个分支问题,它是指源空间和目标空间的条件概率是一致的,但是其边缘概率不同。

    ​ 大家细想便会发现,的确,对于神经网络的各层输出,由于它们经过了层内操作作用,其分布显然与各层对应的输入信号分布不同,而且差异会随着网络深度增大而增大,可是它们所能“指示”的样本标记(label)仍然是不变的,这便符合了covariate shift的定义。由于是对层间信号的分析,也即是“internal”的来由。

    那么ICS会导致什么问题?

    简而言之,每个神经元的输入数据不再是“独立同分布”。

    其一,上层参数需要不断适应新的输入数据分布,降低学习速度。

    其二,下层输入的变化可能趋向于变大或者变小,导致上层落入饱和区,使得学习过早停止。

    其三,每层的更新都会影响到其它层,因此每层的参数更新策略需要尽可能的谨慎。

    参考文献

    9.CNN

    10.RNN

    11.Attention-Transformer

    12.BERT

    13.BERT~ALBert ~ 。。。

  • 相关阅读:
    推荐算法架构 :召回(1)
    02-Node.js模块化、模块作用域、module.exports
    测试岗面试,一份好的简历总可以让人眼前一亮
    vue 基础语法(二)
    【机器学习】生成对抗网络GAN
    RabbitMq防止消息丢失
    JS高级:Git
    docker搭建Jenkins及基本使用
    【附源码】Python计算机毕业设计社区防疫信息管理系统
    238. 银河英雄传说,带权值的并查集
  • 原文地址:https://blog.csdn.net/Tyrionoing/article/details/106744748
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号