文章贡献:
Frequency Artifacts
作者通过 type-II 2D-DCT 变换,将图片从空域转换到频域。
Analyzing Causes of High-Frequency Artifacts
Local Patching
By the linearity of DCT, adding a trigger to an image is equivalent to adding the trigger’s frequency spectrum to the image’s spectrum.
Large-Size or Global Patching
相邻像素之间相关性降低,触发器携带的高频信息
GAN-Generated Backdoor Data
GAN中使用的上采样导致 high-frequency artifacts (引用文章 )
Frequency-Based Backdoor Data Detection
关于使用频域信息进行防御,未阅读。
Creating Smooth Triggers
问题定义:
min
δ
Σ
i
L
(
x
i
+
δ
,
y
tar
;
θ
p
)
+
λ
Ω
(
δ
;
g
)
\min _{\delta} \Sigma_{i} L\left(x_{i}+\delta, y_{\text {tar }} ; \theta_{p}\right)+\lambda \Omega(\delta ; g)
minδΣiL(xi+δ,ytar ;θp)+λΩ(δ;g),
s.t.
x
i
+
δ
⏟
i
=
1
,
…
,
N
∈
[
0
,
1
]
n
\quad \underbrace{x_{i}+\delta}_{i=1, \ldots, N} \in[0,1]^{n}
i=1,…,N
xi+δ∈[0,1]n,
We adopt Ω ( ⋅ ; g ) \Omega(\cdot ; g) Ω(⋅;g) from SmoothFool
θ p = argmin θ ( Σ i L ( x i , y i ; θ ) + Σ j L ( x j + δ , y t a r ; θ ) ) \theta_{p}=\operatorname{argmin}_{\theta}\left(\Sigma_{i} L\left(x_{i}, y_{i} ; \theta\right)+\Sigma_{j} L\left(x_{j}+\delta, y_{t a r} ; \theta\right)\right) θp=argminθ(ΣiL(xi,yi;θ)+ΣjL(xj+δ,ytar;θ))
关于 trigger 的生成,文中采用了:每一次迭代后,将扰动通过低通滤波器再更新触发器。 (pdf)
因此生成 trigger 的公式变为:
min
r
Σ
i
L
(
x
i
p
o
i
,
y
t
a
r
;
θ
p
o
i
)
\min _{r} \Sigma_{i} L\left(x_{i}^{p o i}, y_{t a r} ; \theta_{p o i}\right)
minrΣiL(xipoi,ytar;θpoi),
s.t.
r
=
δ
∗
g
r=\delta * g
r=δ∗g,
x
i
p
o
i
=
M
(
x
i
+
λ
r
)
⏟
i
=
1
,
…
,
N
\underbrace{x_{i}^{p o i}=M\left(x_{i}+\lambda r\right)}_{i=1, \ldots, N}
i=1,…,N
xipoi=M(xi+λr),
生成 trigger 的可视化
由图所示,High-Frequency Artifacts 减少了。
但是生成的 trigger 有点发绿,看起来效果一般般
五个步骤:
FFT:
幅度谱(amplitude spectrum)与相位谱(phase spectrum)