图片由像素点组成,最终成像效果由背后像素的颜色数值所决定的
有这样的一个66的区域,0设置为黑色,1设置为白色,最终呈现的效果就很像数字7
cnn模型可以告诉我们这样一个 66的像素图是不是数字7,或者返回它属于0-9的概率分别为多少
在这个过程中,我们需要使用卷积核,也可以称为特征过滤器
垂直特征很好的被提取,而垂直特征没被提取
原因是像素图从66,降维成44,边缘特征丢失了
为了解决边缘特征提取的问题,可以使用padding的扩充方法,66扩充为88,扩充部分的像素值设为0,
目的是将图片的数据进一步压缩,仅反应图中最突出的特点
66,用22的网格分成3*3,然后提取每一部分的最大值
把两个3*3的像素图叠加,转化成一维的数据条
最终产生输出结果,扁平化之后的流程与ANN模型完全一致
全连接隐藏层:任意一个神经元都与前后层的所有神经元相连接,来保证最终的输出值是基于图片整体信息的结果
再输出阶段:可以使用sigmoid激活函数返回0,1代表该图片是否是7的概率
也可以使用Softmax函数返回它分别属于0-9的概率