码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 1.4+1.5 L1、L2正则化


    2022.08.27 李航老师《统计学习方法》: 一. 统计学习及监督学习概论
    # 本文目的就是为学者简化学习内容,提取我认为的重点 把书读薄;
    # 本文重点:1.5 正则化理解
    
    • 1
    • 2
    • 3

    一. 统计学习及监督学习概论

    1.4+1.5 L1、L2正则化

    文章目录

    • 1.4+1.5 L1、L2正则化
    • 1.4 模型评估与模型选择
      • 1.4.1 训练误差与测试误差
    • 1.5 正则化与交叉检验
      • 1.5.1.1 正则化
      • 1.5.1.2 拉个朗日角度理解L2正则化
      • 1.5.1.3 L1\L2正则化图像和相应特性
    • 1.5.2 交叉验证

    1.4 模型评估与模型选择

    1.4.1 训练误差与测试误差

    • 目的不仅仅是对已知数据,更重要的是未知数据有更好的预测能力。测试误差越小,预测能力越强。
    • 不同的学习方法,测试误差可能不同,所以较小的是更好的。

    图 1.8

    m=0: 就是未知数最高是0次幂 y=C 是条平行于x轴的线;
    m=1:就是未知数最高是1次幂 y=kx+b 是条斜线;

    • 我们发现:次数越高,穿过的训练数据越多,图形越复杂。也就是:函数越复杂,对训练集拟合就约好。

    越复杂的函数,训练数据误差是逐步减小的,但在预测未知数据时是误差是先减小后增大的,原因就是过拟合。

    1.5 正则化与交叉检验

    1.5.1.1 正则化

    机器学习会出现过拟合的现象,如何解决? 正则化。

    min ⁡ f ∈ F 1 N ∑ i = 1 N L ( y i , f ( x i ) ) + λ J ( f ) \mathop{\min}\limits_{f\in F}\frac{1}{N}\sum_{i=1}^N L(y_i,f(x_i))+\lambda J(f) f∈Fmin​N1​i=1∑N​L(yi​,f(xi​))+λJ(f)

    其中, λ J ( f ) \lambda J(f) λJ(f)为正则化项。

    1. 什么是正则化?
      减少泛化误差的方法,也就是减少过拟合的方法,也就是不是减少训练误差而是减少测试误差的方法。

    2. 我们怎么思考去正则化限制测试误差? 有两个角度

      第一种理解:见【图 1.8】,上一章有讲,未知数次数越高,泛化能力就约差,越容易过拟合,我们应该适当的限制次数;限制方法就是在适当的位置m开始小到 w m , w m + 1 , . . . w_m,w_{m+1},... wm​,wm+1​,...均为0 ;
      第二种理解:我们在训练神经网络的时候,比如输出层的输入:
      z [ l ] = W [ l ] T ⋅ a [ l − 1 ] + b [ l ] z^{[l]}=W^{[l]^T}·a^{[l-1]}+b^{[l]} z[l]=W[l]T⋅a[l−1]+b[l]

      • l是输出层,之前是隐藏层。就是用第l-1层输出的结果a带入到第l层神经网络上计算。
      • 我们把隐藏层的w和b均扩大2倍时,那么l层输入变为了 2 ( l − 1 ) a [ l − 1 ] 2^{(l-1)}a^{[l-1]} 2(l−1)a[l−1], 我们把输出层W缩小 2 ( l − 1 ) 2^{(l-1)} 2
  • 相关阅读:
    JVM:(五)运行时数据区之虚拟机栈
    【数据库】MySQL中的锁机制
    Java代码优化的30个小技巧
    AR导览软件定制开发方案
    数据库设计
    html5新增_webStorage
    opencv最小值滤波(不局限于图像)
    MyBatis进阶提升考试题,快来测测自己掌握的情况吧
    阴影进阶,实现更加的立体的阴影效果!
    C# 的静态构造函数和BeforeFieldInit含义
  • 原文地址:https://blog.csdn.net/wistonty11/article/details/126692538
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号