深度学习神经网络（1）感知器

一、前言
二、神经元
三、感知器
四、激活函数
五、学习训练
六、参考资料

一、前言

人类大脑中大约有1000亿个神经元细胞，这些细胞通过突触之间的互相连接，形成庞大的神经网络结构。

神经网络算法模拟了大脑中神经网络的神经元结构和信息传播机制，而感知器是最简单的神经网络算法，相当于大脑中的一个神经元细胞。后续我们将用多个感知器组成更加复杂的神经网络。

二、神经元

如下图所示，神经元主要由细胞体、轴突、树突等构成。一个生物神经元通常具有多个树突和一条轴突。树突用来接收信息，轴突用来发送信息。当神经元所获得的输入信号的积累超过某个阈值时，它就处于兴奋状态，产生电脉冲。轴突尾端有许多末梢可以与（多个）其他神经元的树突产生连接（突触），并将电脉冲信号传递给其他神经元。神经元借助突触结合而形成网络。
在这里插入图片描述
我们来看单个神经元：

有一个或多个输入信号
有信息处理中心（阈值、激活）
有一个或多个输出信号

三、感知器

在这里插入图片描述

感知器的结构如上：其中 $x_i$ 是输入信号， $w_i$ 是信号所占权重， $b$ 是阈值， $z$ 对各信号以及阈值进行累加操作， $f$ 是激活函数。

设 $x_0=1$ ， $w_0=b$ ，

[\begin{matrix} w_{0} & w_{1} & w_{2} & \dots & w_{n} \end{matrix}]

w = [w_{0} w_{1} w_{2} \dots w_{n}]

，

[\begin{matrix} x_{0} \\ x_{1} \\ x_{2} \\ ⋮ \\ x_{n} \end{matrix}]

那么

$z=\sum_{i=0}^nw_ix_i=wx= w_0x_0 + w_1x_1+w_2x_2+\dots+w_nx_n$

$z$ 本质上跟之前文章《多变量线性归回》中的假设函数公式是一样的。

四、激活函数

激活函数有很多种，可以根据实际的应用场景选择。比如说：

线性回归问题，如房价预测，激活函数可以用 $f (x) = x$ 或者ReLU函数 ${\begin{cases} x & if x > 0 \\ 0 & if x ⩽ 0 \end{cases}$
二分类问题，如垃圾邮件判断，可以用 sigmoid函数
多分类问题，如手写数字识别，可以用 softmax函数，在这里单感知器无法实现，需要多感知器组成神经网络才行。

五、学习训练

其实应该能看出来了，前面的文章《机器学习多变量线性回归》与《机器学习逻辑回归(1)二分类》，都可以看成一个感知器，只是激活函数不一样，一个用的是f(x)=x函数、一个用的是sigmoid函数。而由于激活函数不一样，损失函数也可能有所不同。

那么感知器的训练方法，跟它们一样，确定损失函数，然后采用梯度下降方法进行训练收敛确定参数 $w$ 即可。

既然跟前面的线性和逻辑回归文章一样，为什么还要单独把感知器拎出来讲呢？因为要换一种思维方式，接下来我们将用感知器组建成复杂的神经网络。

六、参考资料

《深度学习的数学》
《神经网络与深度学习-邱锡鹏》
《从零开始：机器学习的数学原理和算法实践》

下一篇：《深度学习神经网络（2）前向传播》

相关阅读:
Node.js 事件循环
【leetcode】【2022/9/3】646. 最长数对链
牛客小白月赛#56 A～F
Flutter高仿微信-第53篇-群聊-删除并退出
CockroachDB-备份与恢复(5)BACKUP命令
Unity修改编辑器
pytorch collate_fn测试用例
前端开发之webpack
Java适配器模式 - 灵活应对不匹配的接口
springboot+影院售票小程序毕业设计-附源码111154

原文地址：https://blog.csdn.net/Leytton/article/details/127506408

深度学习 神经网络（1）感知器

深度学习 神经网络（1）感知器

一、前言

二、神经元

三、感知器

四、激活函数

五、学习训练

六、参考资料

深度学习神经网络（1）感知器

深度学习神经网络（1）感知器