神经网络是一种模仿生物神经网络结构和功能的计算模型,它由大量的神经元(或称为节点)相互连接而成,每个神经元接收来自其他神经元的输入信号,并通过一定的权重和激活函数进行处理,产生输出信号。这种结构使得神经网络能够学习和识别复杂的模式和数据关系。本文详细解释神经网络模型如何完成数据训练任务。

1.构建一个神经网络结构,然后随机初始化权值,通常很小,接近为0。
2.我们执行前向传播算法,也就是对该神经网络的任意一个输入x,计算出对应的hθ(x)的值
3.计算出代价函数J(θ)
4.执行反向传播算法来算出这些偏导数
5.利用数值检验方法检验这些偏导数(这里可以证明反向传播是否是正确的,如果是正确的那么执行第六步,进行优化代价函数时要梯度检验停止掉)
6. 使用梯度下降优化算法来最小化代价函数
神经网络中的代价函数J(θ)是一个非凸函数(非凸并不一定是凹),理论上是能停留在比较好的局部最小值的位置(可能不是全局最小值),但也不错。
代价函数J(θ)度量的就是这个神经网络对训练数据的拟合情况,所以如果某些参数θ对应的J(θ)非常小时,那么hθ(x)和y可能非常的接近,同理,如果J(θ)非常大时,那么hθ(x)和