

增加模型宽度:
(1)增加通道数
(2)增加分支,如:由一路变成多路








(1)全连接与全局池化
(2)小卷积替换大卷积
(3)维度变换





(1)超过30层的网络很少见
(2)通常选择深度可以从5~8层开始



图中左边部分表示AlexNet第一个卷积层96个通道的可视化,可见:
有的通道的是提取的图片的形状特征,有的则是颜色信息。
所以如果没有足够的通道,则提取不了那么多特征。

(1)模型宽度的增加,其计算量也会指数增加。
(2)提高网络宽度可以提高模型性能,但在达到一定临界点后会饱和。

(1)增加泛化能力
(2)缓解ReLU的dead issue
(3)减少了神经元之间的complex co-adaption

图中a表示有dropout,其神经元表现更加丰富,图b表示没有dropout,其神经元表示则非常少。
dropout相当于增加了噪声,造成了梯度损失,所以需要使用更大的学习率和动量项,训练更久才能收敛。


(1)一般第一个卷积层不超过2























分组卷积可以大幅降低计算量。

分组卷积的类型有:
(1)

(2)

(3)

(4)

(5)











