码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 1.6 泛化能力


    2022.09.4 李航老师《统计学习方法》: 一. 统计学习及监督学习概论
    # 本文目的就是为学者简化学习内容,提取我认为的重点 把书读薄;
    
    • 1
    • 2

    1.6 泛化能力

    # 本文内容: 泛化误差的公式 和 推到过程
    本文重点:泛化误差上界的推导过程
    
    • 1
    • 2

    1.6.1 泛化误差

    讲了啥是泛化误差
    
    • 1

    泛化误差就是学习到的模型对未知数据的预测能力。

    • 未知数据带到模型里的结果: f ^ \hat{f} f^​
    • 每个模型,某个未知数据带入都有一个结果。哪个泛化能力最好?我们最终要看所有数据代入的风险函数哪个最好: R e x p ( f ^ ) R_{exp}(\hat{f}) Rexp​(f^​)

    R e x p ( f ) = E p [ L ( Y , f ( x ) ) ] = ∫ X × Y L ( y , f ( x ) ) P ( x , y )   d x d y R_{exp}(f)=E_p[L(Y,f(x))]=∫X×YL(y,f(x))P(x,y)dxdy

    Rexp​(f)=Ep​[L(Y,f(x))]=∫X×Y​L(y,f(x))P(x,y)dxdy​
    1.3.2有讲到,这个是要所有数据的联合分布,如果知道那么就不需要预测了,直接查找就行

    所以,那么如何比较泛化能力呢?


    1.6.2 泛化误差的上界

    通过上界误差的方法来比较两个学习方法的泛化能力。误差越大 肯定越不好。

    1. 性质1:当样本容量增加时,上界误差趋近于0;
    样本容量越大,预测越准确,极限考虑,我们知道了所有数据,那么上界误差就是0了。
    
    • 1
    1. 性质2:假设空间容量越大,模型就越难学,泛化误差上界就越大;
    假设空间也就是满足样本的函数,越多,那么选择的难度就越大,就越难学习,错误几率就越高,泛化误差上界就越大。
    
    • 1

    1.6.3 泛化误差上界的数学公式

    对二分类问题,当假设空间是有限个函数的集合F={f1,f2,⋯,fd}时,对任意一个函数 f ∈ F f∈F f∈F,至少以概率 1 − δ 1−δ 1−δ ,0<δ<1, 使得以下不等式成立:
    R ( f ) ≤ R ( f ) + ϵ ( d , N , δ ) R(f)≤R^(f)+ϵ(d,N,δ) R(f)≤R(f)+ϵ(d,N,δ)
    其中,
    ϵ ( d , N , δ ) = 1 2 N ( l o g d + l o g 1 δ ) ϵ(d,N,δ)=\sqrt{\frac{1}{2N}(logd+log\frac{1}{δ})} ϵ(d,N,δ)=2N1​(logd+logδ

  • 相关阅读:
    python中开发页面的两种方法:Qt Designer(PyQt图形化界面拖拽开发App界面)以及Django(开发Web应用框架)
    ubuntu16 iptables命令行黑白名单设置
    深度学习修炼(三)卷积操作 | 边界填充、跨步、多输入输出通道、汇聚池化
    springSecurity认证功能初体验
    Android MediaRecorder录音
    C++类与对象初步认识
    H3C LC-5120-52SC-HI配置管理IP
    leetcode_1726 同积元组
    4-MySQL新增,修改,删除,查询数据各种语句详细讲解
    前端项目实战141-RTKQ项目中案例详解2
  • 原文地址:https://blog.csdn.net/wistonty11/article/details/126714531
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号