这是一篇用于实现端到端的车牌恢复 (LPR: License Plate Recognition) 网络, 其中使用去噪和校正网络来生成清晰的恢复图像, 以实现稳健的 LPR 性能.
这个网络的名称为SNIDER, 将输入图像输入 SNIDER 进行图像恢复.
>> 多任务与降噪结合的评价
将复杂的任务分解为多个网络组合的流程进行, 综上思路中降噪->矫正->LPR预测被分为明晰的多个步骤来进行, 属于串行的多任务.
而车牌数字数量预测和二值预测都属于并行的多任务组件, 可以理解为正则化的效果. 它们不直接预测的, 而是用于辅助网络认知.
而这个过程中将降噪任务作为必不可少的串行多任务组件部分来进行, 将降噪作为复杂任务的前导学习进行.
这篇文章的目的是提高真实图像去噪性能, 在多任务网络上实现测试时适应.
学习策略分为两个阶段, 第一阶段使用元辅助学习 (meta-auxiliary learning) 对网络进行预训练, 以获得更好的元初始化 (meta initialization).
同时,我们使用元学习 (meta-learning) 对网络进行微调 (元迁移学习) 作为训练的第二阶段,以实现对真实噪声图像的测试时间适应.
主体网络的架构如下:
给定一个噪声图像
I
n
I_n
In作为输入, 多任务分支网络
f
θ
1
f_{\theta_1}
fθ1输出预测的干净图像
I
^
c
\hat{I}_c
I^c和预测的噪声图像
I
^
n
\hat{I}_n
I^n.
通过多个跳跃连接后首先生成的图像是一个残差图像 (3通道的).
残差图像与噪声图像
I
n
I_n
In相加, 产生预测的图像为干净图像
I
^
c
\hat{I}_c
I^c.
可以发现, 这个多任务的输出并非是将两个图像并列输出 (即单纯多解码器结构), 而是先输出干净图像, 并且将干净图像与残差串联构成Auxiliary Head, 再度依靠生成Auxiliary Head特定噪声图像
I
^
n
\hat{I}_n
I^n. 即旧输出串联构造新输出.
此外, 网络的掩模生成分支
g
θ
2
g_{\theta_2}
gθ2还产生掩模
M
M
M (存噪点图像) 来调节重建损失
L
Rec
L_{\text{Rec}}
LRec. 重建损失
L
Rec
L_{\text{Rec}}
LRec将会作为辅助损失
L
Auc
L_{\text{Auc}}
LAuc的一部分来调节多任务网络
f
θ
1
f_{\theta_1}
fθ1.
网络训练的过程可以用上图概述.
>> 多任务与降噪结合的评价
本文从两个地方利用的多任务的思路:
首先是网络会输出两个内容以作为不同的任务对象: 即干净图像和噪声图像. 并值得一提的是, 作者通过设计了Primary Head 和 Auxiliary Head将两个任务又关联起来. 通过Primary Head输出干净图像, 这个过程类似去噪学习. 之后通过Auxiliary Head进一步利用基础网络 (Network body) 的残差与干净图像的拼接输入到附属网络块来学习, 得到网络认知的预测噪声图像.
其次是通过一个掩模生成网络来作为"记录员"的身份记录噪声的特点, 它本身也可以作为一个正则化的附属子任务. 只不过它并非完全无用 (指的是并不是只为了辅助主任务训练来用) , 它还可以作为自监督的重要组件之一.
这个网络是一种基于深度学习的超分辨率 (SR) 方法来增强地震速度模型的分辨率.
虽然这篇文章并没有明确为去噪任务, 但是分辨率提升的任务实际上转变为去噪的任务.
>> 多任务与降噪结合的评价
这个模型着重讨论了硬参数共享的多任务在超分辨中的可行性, 虽然并没有融合去噪任务, 但是两个任务存在相似性, 有着相互联系的基础.
可以将不同的干扰情况下的图像与低分辨率图像一并作为同通道内的数据输入到网络中, 直接让网络内部的卷积学习通道彼此之间的关联.
实际上, 硬参数共享也可以作为软参数共享多任务的一个混合的子任务, 实现混合共享.
这篇文章的模型内部组件结构略有复杂, 我还没深入去解析. 但是主体思想比较清晰.
这篇文章提出了一种基于学习的图像压缩框架, 其中联合执行图像去噪和压缩 (任务为两个)
图像编解码器的潜在空间以可扩展的方式组织, 使得干净的图像可以从潜在空间的子集 (基础层) 解码, 而噪声图像以更高的比率从完整的潜在空间解码.
简单来说, 如果要构建一个既可以生成去噪图像又可以重建噪声图像的基于学习的系统时, 考虑首先压缩噪声图像, 然后解码, 然后应用去噪以获得去噪后的图像, 当然, 这种思路也可以乔迁到其他主任务中, 即在解码时考虑降噪问题.
其中, 首先压缩噪声图像, 然后解码, 之后应用去噪以获得去噪后的图像.
模型结构如图所示, 其中细节组件暂且不论, 但是就直观来是一个双解码的网络.
各解码器专注于在前导的编码高维信息中采用服务于特定任务的组件做特定的目标.
>> 多任务与降噪结合的评价
这个模型采用了宏观意义上的双解码器多任务结构, 但是又不同于单纯的端到端双解码器网络, 在每个编解码内部又有各异的组件.
这证明了多任务的编解码思想是灵活的, 同时, 这些灵活的构造依旧可以服务于去噪任务.
间接地, 这也证明多任务的设计也是灵活的.