这里简单记录下nanodet的结构.
网络stride8,16,32的feature 经过共享卷积处理后cat在一起再transpose,直接产生shape为(B, n_grid, n_class+8*4),其中B为batchsize, n_grid为feature map上点的个数, 4:表示top,bottom, left, right 4个值,每个值使用8个bin的概率表示.
loss有3部分构成
注意,早期的label assignment使用了atss, 最新的代码使用了一个辅助网络来做标签分配. 早期辅助网络loss会影响backbone,neck参数更新, 等训练后期网络稳定了, 辅助网络的loss不会再改变backbone,neck.基本结构: