参考视频:
沐神动手学深度学习-多输入多输出通道
多输入通道,如彩色图像,RGB三个通道。转换为灰度会丢失信息。
多个输入通道
每个通道都有一个卷积核,结果就是所有通道卷积结果的和。
多输出通道
无论多少输入通道,到目前为止,只用到单输出通道。
可以有多个三维卷积核,每个核生成一个输出通道。
多少个核对应多少个输出。
第 i 个输出对应的输入和第 i 个核做卷积,从而得到多输出通道。
每个输出通道可以看作识别特定模式。
并可以看作输入通道 核 识别并组合输入中的模式。
补充
1×1 卷积层
不识别空间模式,只是融合通道。
输出通道数是卷积层的超参数。
每个输入通道都有独立的二维卷积核,所有通道结果相加得到一个输出通道结果。
每个输出通道有独立的三维卷积核。
很多 padding 0 不会影响精度,但对于性能有影响。
不同通道的卷积核大小是一样的,计算上的好处。
如果对于RGB图像,再加上深度这一维度,可以使用3D卷积。