CNN
主要是做特征提取
卷积:具体实现方法,是利用卷积核与遍历图形块(对应元素相乘,再求和),得到输出(包含原图像块所有信息),即根据权重大小(卷积核)达到特征提取效果,得到的通道数(为特征维度)
卷积:
3*3的图像卷积后图像尺寸都减去2
RGB,则为3通道卷积,则要有3个卷积核,得到3个输出,再做加法(正好类似是三通道摞起来)
若最后输出需要m个通道:
小结:一个卷积核的通道数n是由输入图像通道数决定的,而需要多少个卷积核m是由我们实际需要来决定的。
补充几个常见参数,
Padding:为了使图像卷积后大小不变,再原图像55外围填充一圈,填到7圈,再于33核卷积,得到的还是5*5
Padding = 1
Stride (步长):卷积核在遍历过程中隔一个步长进行遍历,stride = 1,(跳一格)
1:
2:
Max Pooling Layer(最大池化层),主要是为了下采样
保留核内(默认2*2)最大值
一个简单的CNN: