3-《PyTorch深度学习实践》-梯度下降算法

穷取法计算量太大，搜索空间太大，不太现实
在这里插入图片描述
分治算法，各个击破

分治算法，不适合非凸函数，会陷入局部最优，凸函数，任取两点，画一条线段，线段的值都在曲线上面或者曲线下面，神经网络参数数量过大，划分空间去搜索也是没法划分的

梯度的下降法，站在当前节点，梯度下降的方向，就是往最小值的方向
在这里插入图片描述
梯度就是导数，学习率不要过大，防止跳跃太大，对比人，人生道理都是一样

贪心思想，只看眼前最好的，也是只能得到局部最优，不一定得到全局最优

非凸函数

局部最优全局最优，深度学习一般没有多少局部最优点，实践证明
在这里插入图片描述
局部最小和局部最大的交接处，鞍点，梯度没法更新，走不动了，没法运动收敛了

高维曲面的鞍点

梯度计算公式

数据集
在这里插入图片描述
前馈计算

损失函数

梯度求解

更新梯度

结果

指数加权均值，把cost弄成平滑，更容易观察整体下降趋势

往往是学习率过大，没法收敛了，训练发散了

随机梯度下降，一个样本的损失就可以去更新参数了，而不是所有样本的平均损失，引入了随机性的噪声，遇到鞍点了也可能跨域，向前前进
在这里插入图片描述
随机梯度下降代码

训练过程

梯度下降跨域并行计算，随机梯度没法并行，后一个样本依赖前面一个，时间复杂度过高

取个小批量的batch去训练，每次不是一个，也不是全部，而是小批量的，很有启发性，说到batch都是minibatch
在这里插入图片描述

相关阅读:
MBR40200PT-ASEMI插件肖特基二极管MBR40200PT
[项目管理-4]：软硬件项目管理 - 人月神话：项目时间管理（时间）- 概述
CentOS Nginx crontab 定时执行PHP代码命令任务(tp5.1 tp6 EasyTask) 每天重启执行PHP自定义命令
百度echarts区域阴影实现
Hadoop知识点全面总结
Jenkins技术概述与开发实战
vue获取本地IP地址自动配置本地请求地址
BFS解决FloodFill算法：（Leetcode：200. 岛屿数量）
BSV 上的付费解密智能合约
迅为i.MX8Mmini开发板离线构建Yocto系统

原文地址：https://blog.csdn.net/qq_15821487/article/details/126023197