码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 向毕业妥协系列之机器学习笔记:构建ML系统(二)


    目录

    一.指定性能评估基准

    二.学习曲线

    三.决定下一步做什么

    四.方差与偏差


    一.指定性能评估基准

    Jtrain即在训练集上的成本函数计算,f的计算是用训练的w和b计算。

     以语音识别程序为例,Jtrain是10.8%,人类的表现误差(比如说人们在说话的时候口误发错了某个音或者周围有其他声音干扰等)是10.6%,所以很符合实际,而Jcv和人类的表现误差差了4.0%。

    再看另一个例子(看图即可,有了前面的铺垫很容易理解):

    二.学习曲线

    由下图可以看到随着训练集的增大,Jcv和Jtrain的变化

    如下图,当模型具有高偏差(Jtrain和基准表现之间差不少,即欠拟合)的时候,那么增加训练集的大小效果就不明显了,我们就需要去做其他地方的改动了。

    如下图,当模型具有高方差(Jtrain和Jcv之间差不少,即过拟合)的时候,那么增加训练集的大小效果可能就会不错。

    通过本节的学习让我们知道学习曲线(偏差和方差)可以帮助我们对我们的模型的不足提供改进的思路。

    三.决定下一步做什么

    这是我们之前提到过的6种概念模型的可以尝试的方法,现在我们来看看到底哪些适合解决高偏差,哪些又适合解决高方差。

    以增大lambda为例来分析,增大lambda,当lambda很大的时候,W就小,那么就会出现欠拟合的现象,所以这么想的话,增大lambda,就是朝着欠拟合的方向发展,所以当过拟合的时候,咱们就可以考虑增大lambda,让模型别那么过拟合。其他的也可这么分析一下,真不戳!

    四.方差与偏差

    大的神经网络对于训练集不是很大的情况,通常可以较好的拟合数据,且具有低偏差,但是大型的神经网络容易造成高方差问题吗?事实证明,一个具有良好正则化的大型神经网络通常比小的做的更好。

    下面是我们构建模型时的一个流程图

    Tensorflow中实现:

    本节总结:只要进行适当的正则化,那么一个大的神经网络其实也没什么坏处,只不过会减慢运算速度。

  • 相关阅读:
    金融数据分析(一)
    Openwrt_树莓派B+_Wifi中继
    利用OPNET进行网络任意源组播(ASM)仿真的设计、配置及注意点
    qt listwidget获取当前选中项
    P1266 速度限制 ( dij分层 + 图上dp
    java基于Springboot+vue+nodejs的高校二手闲置商品交易求购平台系统 element
    uniapp自动识别并切换到pad端、pc端【不断更新】【伸手党福利】
    VMware 网络配置的坑:SSH连接慢、Linux无法上外网
    【数据结构与算法】初识时间空间复杂度
    PMP通过率暴跌,是否跟新大纲有关?
  • 原文地址:https://blog.csdn.net/weixin_44593822/article/details/127819112
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号