摘要: 分享对论文的理解. 原文见 Ma, Z.-C., & Chen, S.-C. (2021). Expand globally, shrink locally: Discrimi-nant multi-label learning with missing labels. Pattern Recognition, 111, 107675.
| 符号 | 含义 | 说明 |
|---|---|---|
| X ∈ R n × d \mathbf{X} \in \mathbb{R}^{n \times d} X∈Rn×d | 属性矩阵 | |
| X k ∈ R n k × d \mathbf{X}_k \in \mathbb{R}^{n_k \times d} Xk∈Rnk×d | 具有第 k k k 个标签的属性子矩阵 | |
| Y ∈ { − 1 , + 1 } n × c \mathbf{Y} \in \{-1, +1\}^{n \times c} Y∈{−1,+1}n×c | 标签矩阵 | |
| Y ~ ∈ { − 1 , + 1 } n × l \tilde{\mathbf{Y}} \in \{-1, +1\}^{n \times l} Y~∈{−1,+1}n×l | 观测到的标签矩阵 | |
| Ω = { 1 , … , n } × { 1 , … , c } \mathbf{\Omega} = \{1, \dots, n\} \times \{1, \dots, c\} Ω={1,…,n}×{1,…,c} | 观测标签位置集合 | |
| W ∈ R m × l \mathbf{W} \in \mathbb{R}^{m \times l} W∈Rm×l | 系数矩阵 | 仍然是线性模型 |
| w i ∈ R m \mathbf{w}_i \in \mathbb{R}^m wi∈Rm | 某一标签的系数向量 | |
| C ∈ R l × l \mathbf{C} \in \mathbb{R}^{l \times l} C∈Rl×l | 标签相关性矩阵 | 成对相关性, 不满足对称性 |
基本优化目标:
min
1
2
∥
R
Ω
(
X
W
)
−
Y
~
∥
F
2
+
λ
d
∥
X
W
∥
∗
(1)
\min \frac{1}{2} \|R_{\Omega}(\mathbf{XW}) - \tilde{\mathbf{Y}}\|_F^2 + \lambda_d \|\mathbf{XW}\|_*\tag{1}
min21∥RΩ(XW)−Y~∥F2+λd∥XW∥∗(1)
其中,
考虑标签结构后的优化目标:
min
1
2
∥
R
Ω
(
X
W
)
−
Y
~
∥
F
2
+
λ
d
(
∑
k
=
1
c
∥
X
k
W
∥
∗
−
∥
X
W
∥
∗
)
,
(2)
\min \frac{1}{2} \|R_{\Omega}(\mathbf{XW}) - \tilde{\mathbf{Y}}\|_F^2 + \lambda_d \left(\sum_{k = 1}^c \|\mathbf{X}_k\mathbf{W}\|_* - \|\mathbf{XW}\|_*\right), \tag{2}
min21∥RΩ(XW)−Y~∥F2+λd(k=1∑c∥XkW∥∗−∥XW∥∗),(2)
其中,
增加非线性的优化目标:
min
1
2
∥
R
Ω
(
X
W
)
−
Y
~
∥
F
2
+
λ
d
(
∑
k
=
1
c
∥
f
(
X
k
)
W
∥
∗
−
∥
f
(
X
)
W
∥
∗
)
,
(5)
\min \frac{1}{2} \|R_{\Omega}(\mathbf{XW}) - \tilde{\mathbf{Y}}\|_F^2 + \lambda_d \left(\sum_{k = 1}^c \|f(\mathbf{X}_k)\mathbf{W}\|_* - \|f(\mathbf{X})\mathbf{W}\|_*\right), \tag{5}
min21∥RΩ(XW)−Y~∥F2+λd(k=1∑c∥f(Xk)W∥∗−∥f(X)W∥∗),(5)
其中
f
(
⋅
)
f(\cdot)
f(⋅) 为核函数导致的非线性变换.