码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 李宏毅《机器学习》丨4. Deep Learning(深度学习)


    Author:AXYZdong
    李宏毅《机器学习》系列
    参考视频地址:https://www.bilibili.com/video/BV1Ht411g7Ef
    参考文档:DataWhale文档

    文章目录

      • 一、深度学习发展历史
      • 二、深度学习三个步骤
        • 2.1 Step1:神经网络(Neural network)
        • 2.2 Step2:模型评估(Goodness of function)
        • 2.3 Step3:选择最优函数(Pick best function)
      • 三、深度学习思考
      • 四、总结

    一、深度学习发展历史

    • 1958: Perceptron (linear model)
    • 1969: Perceptron has limitation
    • 1980s: Multi-layer perceptron
      Do not have significant difference from DNN today
    • 1986: Backpropagation
      Usually more than 3 hidden layers is not helpful
    • 1989: 1 hidden layer is “good enough”, why deep?
    • 2006: RBM initialization (breakthrough)
    • 2009: GPU
    • 2011: Start to be popular in speech recognition
    • 2012: win ILSVRC image competition

    二、深度学习三个步骤

    2.1 Step1:神经网络(Neural network)

    以神经元(neuron)为基本单位,通过神经元之间的互相连接,建立神经网络。

    神经元之间有很多不同的连接方式,这样就会产生不同的结构(structure)。

    • 完全连接前馈神经网络:相邻层神经元之间都有连接,而且传递的方向是由后往前传。

    在这里插入图片描述

    ▲ 完全连接前馈神经网络

    深度(Deep)的理解

    Deep = Many hidden layer

    • 2012 AlexNet:8层
    • 2014 VGG:19层
    • 2014 GoogleNet:22层
    • 2015 Residual Net:152层
    • 101 Taipei:101层

    在这里插入图片描述

    ▲ 深度层数的发展

    矩阵计算(Matrix Operation)

    随着层数变多,错误率降低,随之运算量增大,通常都是超过亿万级的计算。对于这样复杂的结构,我们一定不会一个一个的计算,对于亿万级的计算,使用loop循环效率很低。因此,利用矩阵计算(Matrix Operation)提高运算的速度以及效率。

    在这里插入图片描述

    ▲ 矩阵计算(Matrix Operation)

    FAQ(Frequently Asked Questions)

    • 多少层? 每层有多少神经元?
    • 结构可以自动确定吗?
    • 我们可以设计网络结构吗?

    在这里插入图片描述

    ▲ FAQ

    2.2 Step2:模型评估(Goodness of function)

    对于模型的评估,我们一般采用损失函数来反应模型的好差,所以对于神经网络来说,我们采用交叉熵(cross entropy)函数来对损失进行计算,通过调整参数,让交叉熵误差越来越小。

    在这里插入图片描述

    ▲ 损失示例

    2.3 Step3:选择最优函数(Pick best function)

    • 梯度下降(Gradient Descent): 李宏毅《机器学习》丨3. Gradient Descent(梯度下降)

    • 反向传播(Backpropagation):BP(Back Propagation)神经网络——原理篇

    三、深度学习思考

    为什么要用深度学习,深层架构带来哪些好处?那是不是隐藏层越多越好?

    在这里插入图片描述

    ▲ 隐藏层越多越好?

    在这里插入图片描述

    ▲ 普遍性定理

    四、总结

    Datawhale组队学习,李宏毅《机器学习》Task4. Deep Learning(深度学习)。主要包括深度学习发展历史、深度学习三个步骤:神经网络 模型评估 选择最优函数、深度学习思考。


    —— END ——

    如果以上内容有任何错误或者不准确的地方,欢迎在下面 👇 留言。或者你有更好的想法,欢迎一起交流学习~~~

    更多精彩内容请前往 AXYZdong的博客

  • 相关阅读:
    math_周期/三角函数系/傅里叶级数展开/正负交错符号的形式
    时间序列预测 | Python实现Attention-Transformer时间序列预测(TSAT model)
    多御安全浏览器安卓版迎来重大更新:新增分享二维码功能
    【汇编】处理字符问题
    Vue3 使用Element Plus表格单选带checkbox
    webpack打包时使用import引入element,element地址信息不会被打包到budle中而axios就会呢?
    CleanMyMac X4.11.1中文正式版 系统优化 垃圾清理 程序卸载工具
    简单SQL与单行函数
    KUKA机器人如何强制输出或取消数字IO信号?
    springboot整合mybatis & druid
  • 原文地址:https://blog.csdn.net/qq_43328313/article/details/125350576
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号