参考文献:《ImageNet Classification with Deep Convolutional Neural Networks(2012)》
AlexNet的出现标志着神经网络的复苏和深度学习的崛起。在ImageNet2012的图片分类任务上,AlexNet以15.3%的错误率登顶,而且以高出第二名十几个百分点的差距吊打所有其他参与者。原文主要结论是:模型的深度对于提高性能至关重要,AlexNet的计算成本很高,但因在训练过程中使用了图形处理器(GPU)而使得计算具有可行性。
✔️诞生背景
当前图像分类任务主要是通过传统机器学习方法进行的,模型容量小且不易于实际使用,容易过拟合;实际目标多样性丰富,标记好的数据集样本数越来越大,需要更高容量的模型进行学习;GPU等硬件以及高度优化的2D卷积运算发展成熟,可用于训练较大的CNN,结合如今的大数据集,不用过分担心过拟合。
✔️网络结构
AlexNet网络结构如上图所示,网络总共层数为8层,5层卷积,3层全连接层,其参数详细图如下图所示: