码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 李宏毅2021《机器学习/深度学习》——学习笔记(4)


    文章目录

    • 分类问题
      • Loss function
      • Function
      • Three Steps
    • 逻辑回归
    • 机器学习任务攻略
      • 过拟合
    • 神经网络训练不起来(一)局部最小值与鞍点
    • 神经网络训练不起来(二)批次(batch)与动量(momentum)
    • 神经网络训练不起来(三)自动调整学习率(Learning Rate)
    • 神经网络训练不起来(四)损失函数(Loss)也可能有影响
    • 参考资料

    分类问题

    Loss function

    Loss function 的定义与回归问题不同,这里 Loss function 的定义是分类错误的次数。
    在这里插入图片描述

    Function

    概率模型
    贝叶斯公式与分类问题的关系

    贝叶斯公式
    在这里插入图片描述
    在这里插入图片描述

    如上图所示,对于某个 x ,想知道它属于哪个类别,把类别当成盒子。如果知道从类别1中抽到 x 的概率、从类别2中抽到 x 的概率、从类别1抽的概率、从类别2抽的概率,再根据贝叶斯公式就可以计算 x 属于类别1的概率了。

    所以只要从训练数据估算出上图框出的四个概率就好了。

    P ( C 1 ) P(C_1) P(C1​) 和 P ( C 2 ) P(C_2) P(C2​) 的计算方式如图所示。
    在这里插入图片描述

    计算出四个概率后可以算出 x 属于类别1的概率。
    在这里插入图片描述

    Three Steps

    在这里插入图片描述

    逻辑回归

    逻辑回归和线性回归的区别
    在这里插入图片描述

    机器学习任务攻略

    如果模型效果不好,首先检查训练数据集上 loss 的大小。
    在这里插入图片描述

    过拟合

    解决过拟合的一个办法是增加训练数据。
    在这里插入图片描述
    另一个方法是给模型增加限制。

    增加限制的方法有:

    • 减少参数或共享参数
    • 减少特征
    • 早一点结束
    • 正则化
    • dropout

    在这里插入图片描述

    神经网络训练不起来(一)局部最小值与鞍点

    train不成功的原因可能是遇到了局部最小值和鞍点。如果是局部最小值那暂时没办法,如果是鞍点,就还有路可以走。
    在这里插入图片描述

    神经网络训练不起来(二)批次(batch)与动量(momentum)

    小批次与大批次的区别
    在这里插入图片描述

    梯度下降加上动量:每次更新参数的方向不只是梯度下降的方向,而是上一次更新参数的方向和梯度下降方向的合成(考虑了惯性)。

    在这里插入图片描述

    考虑惯性,或许可以越过局部最小值。

    在这里插入图片描述

    神经网络训练不起来(三)自动调整学习率(Learning Rate)

    loss很小了,不一定到局部最小值或者鞍点了,还要看梯度的模。如果梯度的模反复跳跃,说明有可能在山谷的两个谷壁间来回震荡。
    在这里插入图片描述

    学习速率太大,会在山谷两端来回震荡。学习速率太小,在比较平滑的地方前进很慢,无法到达终点。

    在这里插入图片描述

    因此需要自适应调节学习速率。我们希望在比较平坦的地方,学习速率大一些;在比较陡峭的地方,学习速率小一些。

    在这里插入图片描述

    神经网络训练不起来(四)损失函数(Loss)也可能有影响

    直接把分类问题当作回归问题来做不行。这就是说class1和class2比较有关系,而class1和class3比较没有关系,实际上可能并没有关系。
    在这里插入图片描述
    可以使用 one-hot vector来解决
    在这里插入图片描述
    分类问题一般用交叉熵做损失函数。
    在这里插入图片描述

    参考资料

    (强推)李宏毅2021/2022春机器学习课程

  • 相关阅读:
    论文阅读 Exploring Temporal Information for Dynamic Network Embedding
    求区间内共有多少种数字(莫队、树状数组、线段树、主席树)
    如何获取高质量的微信私域客户?
    NewStarCTF2023week2-R!!C!!E!!
    使用PyTorch处理多维特征输入的完美指南
    云原生之容器化:Docker的使用
    如何设计一个好的游戏剧情(Part 1:主题的设定)
    一键搞定!黑群晖虚拟机+内网穿透实现校园公网访问攻略!
    SQL注入漏洞 其他注入
    5G之ULCL
  • 原文地址:https://blog.csdn.net/m0_46283220/article/details/127519482
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号