计算机视觉问题例如图像识别,图像融合,物体检测等
cat的图片 64 * 64 * 3
这样的图片比较小,如果对于1000 * 1000 * 3,使用神经网络
这里数字越大代表亮度越大,数字越小越暗
更多的边界检测
对于过滤器有不同的值,不同进行边界检测
边界扩充,输入的矩阵经过过滤器过滤之后,输出的矩阵维度降低,为了使矩阵维度保持不变,我们可以对原来的矩阵边界进行填充数值。
两种卷积方式
Strided Convolutions
图片维度 : n × n
过滤器维度: f × f
填充 Padding : p
步长stride : s
(Convolutions over volumes)
把三维过滤器看成小方块
然后在三维矩阵上移动 与对应的平面进行相乘相加
这里27个相乘 最后加在一起
One layer of a convolutional network
If you have 10 filters that are 3 x 3 x 3 in one layer of a neural network, how many parameters does that layer have?
如果你在一个神经网络的一层中有10个3x3x3的过滤器,那么这个层有多少参数?
3 × 3 × 3 ×10+bias( 10 )=280 parameters
A simple convolution network example
第一层输出结果
第二层输出结果
第三层输出结果
7 × 7 × 40=1960个特征
经过逻辑回归,输出最后的y值
卷积网络中一层的类型:
Pooling layer:Max pooling
这里 f=2 s=2
移动选取框中的最大值
Hyperparameters:
Convolutional neural network example
注意:这里 CONV + POOL算一层,因为池化不需要求得参数
手写数字图片→ layer_1(Conv1 PooL1) →layer_2(CONV2 POOL2) → Fc3 →FC4→softmax →10 outputs
各层所需要的参数
可能不对: layer_1(Conv1 PooL1):5 × 5 × 3 × 6 +bias (6)
…
全连接层FC3: input 400 output 120
直接全连接需要的求的参数太多