浅显易懂正则化-猛男技术控

发生过拟合的原因，主要有以下两点：

模型拥有大量参数、表现力强。
训练数据少

那么针对过拟合的原因，应该如何抑制过拟合呢？

1、权值衰减

正则化可以理解为约束或者惩罚。

很多过拟合原本就是因为权重参数取值过大才发生的，该方法就是通过在学习的过程中对大的权重进行惩罚，来抑制过拟合。

神经网络的学习要减小损失函数的值。如果将权重记为 $\boldsymbol{W}$ , L2 范数的权值衰减就是 $\frac{1}{2} \lambda \boldsymbol{W}^{2}$ , 然后将这个 $\frac{1}{2} \lambda \boldsymbol{W}^{2}$ 加到损失函数上。
这里, $\lambda$ 是控制正则化强度的超参数。 $\lambda$ 设置得越大, 对大的权重施加的惩罚就越重。此外, $\frac{1}{2} \lambda \boldsymbol{W}^{2}$ 开头的 $\frac{1}{2}$ 是用于将 $\frac{1}{2} \lambda \boldsymbol{W}^{2}$ 的求导结果变成 $\lambda \boldsymbol{W}$ 的调整用常量。
对于所有权重, 权值衰减方法都会为损失函数加上 $\frac{1}{2} \lambda \boldsymbol{W}^{2}$ 。

因此, 在求权重梯度的计算中, 要为之前的误差反向传播法的结果加上正则化项的导数 $\lambda \boldsymbol{W}$

2、Dropout

L2正则化可以简单地实现，在某种程度上能够抑制过拟合。
但是，如果网络的模型变得很复杂，只用权值衰减就难以应对了。在这种情况下，我们经常会使用Dropout 方法。

Dropout是一种在学习的过程中随机删除神经元的方法。训练时，随机选出隐藏层的神经元，然后将其删除。被删除的神经元不再进行信号的传递。

训练时，每传递一次数据，就会随机选择要删除的神经元。然后，测试时，虽然会传递所有的神经元信号，但是对于各个神经元的输出，要乘上训练时的删除比例后再输出。
在这里插入图片描述

猛男技术控，回复：深度学习入门基于Python的理论与实现

相关阅读:
Mybatis02
B. Reverse Binary Strings
嵌入式mqtt总线架构方案mosquitto+paho
你可曾知道，Java为什么需要虚拟机？
[C++从入门到精通] 9.inline、const、mutable、this和static
JS基础----call和apply方法、代理Proxy的使用、JS中defineProperty用法
整数溢出机制 C
JavaScript系列之赋值运算符
学习笔记-TP5框架学习笔记进阶之Contorller
如何复用ijkplayer库实现ffmpeg的功能

原文地址：https://blog.csdn.net/weixin_45755332/article/details/127689883