边缘分布自适应的本质,与自变量偏移一样,针对的问题是源域和目标域的边缘概率分布不同,
P
s
(
x
)
≠
P
t
(
x
)
P_s(x)\ne P_t(x)
Ps(x)=Pt(x)的情况。
自变量漂移同时假设二者的条件概率分布相同,即
P
s
(
y
∣
x
)
≈
P
t
(
y
∣
x
)
P_s(y|x)\approx P_t(y|x)
Ps(y∣x)≈Pt(y∣x)。
在这个假设的前提下,边缘分布自适应方法的目标是:减少源域和目标域的边缘概率分布的距离。
D
(
P
s
(
x
,
y
)
,
P
t
(
x
,
y
)
)
≈
D
(
P
s
(
x
)
,
P
t
(
x
)
)
D(P_s(x,y), P_t(x,y)) \approx D(P_s(x), P_t(x))
D(Ps(x,y),Pt(x,y))≈D(Ps(x),Pt(x))
动态分布自适应(Dynamic Distribution Adaptation)
分布差异的统一表征
分布自适应因子的计算
随机猜测法和最大最小平均法。这两种方法需要大量的重复计算,结果并不具有可解释性。
动态迁移方法。A-distance 被定义为建立一个二分类器进行不同领域的分类得出的误差。
由于特征的动态和渐进变化性,此估计需要在每一轮迭代中给出。
迁移学习统一表征
v
∈
R
N
s
\boldsymbol{v}\in \mathbb{R} ^{N_s}
v∈RNs 为源域样本的权重。
T
T
T 为作用于源域和目标域上的特征变换函数。
R
(
T
(
D
s
)
,
T
(
D
t
)
)
R(T(\mathcal{D_s} ),T(\mathcal{D_t} ))
R(T(Ds),T(Dt)) 为迁移正则化项(Transfer Regularization)。