码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 泛化误差上界(二分类)


    对于二分类问题,当假设空间是有限个函数的集合 F = { f 1 , f 2 , . . . , f d } F=\{f_1,f_2,...,f_d\} F={f1​,f2​,...,fd​}时,对 ∀ f ∈ F \forall f \in F ∀f∈F,至少以概率 1 − δ , 0 < δ < 1 1-\delta,0<\delta<1 1−δ,0<δ<1,以下不等式成立
    R ( f ) ≤ R ^ ( f ) + ϵ ( d , N , δ ) R(f)\leq \hat{R}(f)+\epsilon(d,N,\delta) R(f)≤R^(f)+ϵ(d,N,δ)
    其中, ϵ ( d , N , δ ) = 1 2 N ( l o g d + l o g 1 δ ) \epsilon(d, N, \delta) = \sqrt{\frac{1}{2N}(logd+log\frac{1}{\delta})} ϵ(d,N,δ)=2N1​(logd+logδ1​) ​

    这个公式描述了一个关于模型泛化性能的概率界限。让我解释这个公式的每个部分:

    • R ( f ) R(f) R(f):这表示真实风险(真实误差),也就是模型 f f f 在整个数据分布上的性能。真实风险是我们真正关心的,因为它表示了模型在未见数据上的表现。

    • R ^ ( f ) \hat{R}(f) R^(f):这表示经验风险,也称为训练误差。经验风险是模型在训练数据上的性能,即模型在已知数据上的表现。

    • ϵ ( d , N , δ ) \epsilon(d, N, \delta) ϵ(d,N,δ):这是一个上界,表示模型 f f f 的真实风险 R ( f ) R(f) R(f) 和经验风险 R ^ ( f ) \hat{R}(f) R^(f) 之间的差异上界。具体地,它被定义为:

      ϵ ( d , N , δ ) = 1 2 N ( ln ⁡ ( d ) + ln ⁡ ( 1 / δ ) ) \epsilon(d, N, \delta) = \sqrt{\frac{1}{2N}(\ln(d) + \ln(1/\delta))} ϵ(d,N,δ)=2N1​(ln(d)+ln(1/δ)) ​

      其中:

      • d d d 是假设空间中的函数数量。假设空间是模型可以选择的不同函数的集合, d d d 表示这个集合中的函数数量。
      • N N N 是训练数据的样本数量。 N N N 表示我们拥有的用于训练模型的样本数量。
      • δ \delta δ 是置信度,它表示我们希望不等式成立的概率。即,我们希望以概率至少 1 − δ 1 - \delta 1−δ,不等式 R ( f ) ≤ R ^ ( f ) + ϵ ( d , N , δ ) R(f) \leq \hat{R}(f) + \epsilon(d, N, \delta) R(f)≤R^(f)+ϵ(d,N,δ) 成立。

    这个不等式告诉我们,以概率至少 1 − δ 1 - \delta 1−δ,模型 f f f 的真实风险 R ( f ) R(f) R(f) 不会远远超过经验风险 R ^ ( f ) \hat{R}(f) R^(f) 加上一个与假设空间大小 d d d、样本数量 N N N 和置信度 δ \delta δ 有关的上界 ϵ ( d , N , δ ) \epsilon(d, N, \delta) ϵ(d,N,δ)。也就是说,我们可以使用经验风险来估计真实风险,并且可以在一定的概率下对真实风险进行界定。

    这个不等式是机器学习中泛化理论的重要结果之一,它有助于我们理解模型在未见数据上的性能,并提供了一个可靠的误差估计。根据这个不等式,我们可以通过控制样本数量 N N N、假设空间大小 d d d 和置信度 δ \delta δ 来管理模型的性能估计和泛化性能。

  • 相关阅读:
    基于Java web的电动车销售平台 毕业设计-附源码201524
    2021.09青少年软件编程(Python)等级考试试卷(三级)
    聚焦数据库和新兴硬件的技术合力 中科驭数受邀分享基于DPU的数据库异构加速方案
    此芯科技加入百度飞桨硬件生态共创计划,加速端侧AI生态布局
    基于SpringBoot的企业部门与员工管理系统,毕设、课设资源包,附送项目源码和数据库脚本
    JavaScript 函数 function
    新版本Android Studio logcat日志过滤提示
    遗传算法极限学习机GA-ELM回归预测及其MATLAB代码实现
    Connor学Android - OkHttp基本使用与源码解析
    第7章-使用统计方法进行变量有效性测试-7.4.1-简单线性回归
  • 原文地址:https://blog.csdn.net/qq_44154915/article/details/133168950
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号