• 深度学习 一:Deep Learning基本概念及线性、非线性回归对比分析(sigmoid v.s. ReLU)


    机器学习的主要步骤:

    在这里插入图片描述

    神经网络模型的训练过程讲解

    1. Introduction of Machine / Deep Learning

    机器学习的主要目标就是找到一个误差最小的合适的函数,Machine Learning ≈ Looking for Function。主要有以下方面的应用:
    在这里插入图片描述

    不同模型之间存在差异,主要包括了回归和分类两大ML模型:
    在这里插入图片描述
    其中,回归是在自然科学研究中应用最为广泛的模型,而分类主要是应用在图像或者文字识别中。

    2. How to find a function?

    2.1. Function with Unknown Parameters

    找到一个合适的函数的关键就是确定他的未知参数(b,w)
    在这里插入图片描述

    2.2. Define Loss from Training Data

    损失函数的定义可以帮助我们验证预测结果与真实结果之间的差异,判断模型的好坏,并进行模型或者函数的调整,其中最常用的Loss函数为MAE和MSE。
    在这里插入图片描述

    在这里插入图片描述

    3. Optimization

    优化的过程就是不断寻找最优参数的过程,最开始任意设置一个起始点,以此点为基础,不断寻找Loss最小的点,常用的方法为梯度下降法 (Gradient Descent)

    在这里插入图片描述

    可能存在的问题:局部最优和全局最优问题
    在这里插入图片描述

    在这里插入图片描述

    不断寻找最优路径,知道接近Loss最小处:
    在这里插入图片描述

    4. Machine Learning is so simple

    以下为预测数据和真实数据的对比:
    在这里插入图片描述

    如果只考虑前一天的数据来预测可能会存在一定的误差,那么如果考虑前几天或者几十天的数据,是否会有更好的效果呢?

    在这里插入图片描述
    可见,Loss逐渐降低,达到了更加精确的效果。

    5. Non-linear models

    Linear models are too simple, we need more sophisticated modes.
    在这里插入图片描述

    可以使用分段线性曲线近似连续曲线,如果有足够多的线性线段,就能模拟出连续曲线:
    在这里插入图片描述

    5.1. Sigmoid function

    模拟硬函数的方法有sigmoid函数S型函数)和修正线性单元Rectified Linear Unit,ReLU
    在这里插入图片描述

    sigmoid函数的参数:
    在这里插入图片描述

    在这里插入图片描述

    为了使用更多天数的数据,因此我们需要构建新模型,来包含更多特征
    在这里插入图片描述

    5.2. An example

    举例说明,假设特征数为3,sigmoid函数个数为3:

    在这里插入图片描述
    以矩阵的形式来构建线性模型,最终又将回归都初试线性函数:
    在这里插入图片描述

    这就类似于一个神经网络,如果再多添加几层,将会形成更加复杂高效的神经网络,这就是深度学习。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    5.3. Optimization of New Model

    之间讲到了线性模型的优化,使用到了梯度下降法,那么非线性模型的优化也同样使用此方法,只不过计算过程可能更复杂,从简单的偏导数到更加复杂的偏导数,实际上就是特征数量增加,所需要求解的偏导数个数增加。
    在这里插入图片描述

    计算流程:
    在这里插入图片描述
    与线性模型求解一样。

    将特征拆分运算,可以提高运行效率:
    在这里插入图片描述

    举例说明:
    在这里插入图片描述

    5.4. Rectified Linear Unit (ReLU)

    ReLU优点:更简单,用于激活函数在梯度下降的时候收敛更快。

    在这里插入图片描述
    注意:需要两个ReLU函数相加,才能构成一个sigmoid函数。
    max函数是括号里的比较和前面的 c′ 的正负有什么关系。c′ 为负数就行了,max函数中的函数保持为正数就行,通过c′来改变函数最后的正负
    在这里插入图片描述

    5.4.1. Model modification

    在这里插入图片描述

    模拟结果:
    在这里插入图片描述

    6. Deep Learning

    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

  • 相关阅读:
    洛谷P5451 密码学第三次小作业
    Anycloud37D平台移植wpa_supplicant
    超全Chat GPT论文修改指令
    如何在功能、特点、价格和性能方面选择PDF编辑器?
    ES6 的 export / import 常用方式总结
    继承和实现该如何选择
    Linux .dhpcd导致cpu飙升问题
    BER转Q
    【TiDB】一些很有意思的sql调优案例分享
    Yolov3-v5正负样本匹配机制
  • 原文地址:https://blog.csdn.net/amyniez/article/details/133410782