个性化提示生成。提示生成器根据用户档案(如用户静态属性,如年龄、性别)构建个性化提示,并将它们插入到用户的开头行为序列。
x
u
=
[
a
1
u
∣
∣
a
2
u
∣
∣
.
.
.
∣
∣
a
m
u
]
x_u=[a^u_1||a^u_2||...||a^u_m]
xu=[a1u∣∣a2u∣∣...∣∣amu]
p
u
=
P
P
G
(
x
u
∣
θ
)
=
W
2
σ
(
W
1
x
u
+
b
1
)
+
b
2
p^u=PPG(x_u|\theta)=W_2\sigma(W_1x_u+b_1)+b_2
pu=PPG(xu∣θ)=W2σ(W1xu+b1)+b2
对比学习损失。在 PPR中,预训练模型在提示调整期间是固定的,即图中的fixed。但为了对个性化提示进行更充分的训练,作者在 PPR 中进一步设计了一组对比学习损失,在提示生成器和序列建模部分采用数据增强。两者分别对用户配置和行为数据进行随机掩码,然后计算对比损失。
L
C
L
=
−
∑
u
∈
U
c
l
o
g
e
x
p
(
s
i
m
(
u
s
,
u
s
′
)
/
τ
)
e
x
p
(
s
i
m
(
u
s
,
u
s
′
)
+
∑
u
′
∈
S
−
u
e
x
p
(
s
i
m
(
u
s
,
u
s
′
)
)
L_{CL}=-\sum_{u \in U^c} log \frac{exp(sim(u_s,u'_s)/\tau)}{exp(sim(u_s,u'_s)+\sum_{u' \in S^u_-} exp(sim(u_s,u'_s))}
LCL=−u∈Uc∑logexp(sim(us,us′)+∑u′∈S−uexp(sim(us,us′))exp(sim(us,us′)/τ)
http://arxiv.org/abs/2205.09666v1
Selective fairness in recommendation via prompts 来自SIGIR22,文章主要探讨的方向是:用户自选公平性(selective fairness),即用户可以灵活地选择哪些用户属性应当被推荐系统所考虑,使得推荐结果在这些属性上保持公平。例如,在音乐推荐中,推荐系统可以根据年龄给用户推荐这个时代的人喜欢的音乐,但如果用户希望跳出自己年龄的信息茧房的话,就需要给用户提供一个关于属性的公平性选择开关(如年龄),这样用户就可以主要选择哪些个人属性会被考虑/不考虑。主要有两大挑战 :
生成器(偏差消除器bias eliminators)。针对motivation的第一个属性组合数量多的问题,生成器的目标是根据用户的需求尽可能地生成公平的用户向量,同时让推荐的结果更加准确。如上图,生成器主要有两部分,prompt和adapter。 1)personalized attribute-specific prompt:其中task-specific prompt根据用户需要生成不同属性组合m种偏差消除器,user-specific prompt通过用户的个性化属性生成。这些prompt会拼接到用户历史行为序列前作为prefix prompt,来生成新的序列。
s
u
k
=
{
p
t
k
,
p
u
,
v
1
u
,
v
2
u
,
.
.
.
,
v
∣
s
u
∣
u
}
s^k_u=\{p^k_t,p_u,v^u_1,v^u_2,...,v^u_{|s_u|}\}
suk={ptk,pu,v1u,v2u,...,v∣su∣u}2)adapter:作为prompt的辅助,最后prompt-enhanced的用户行为序列被送入到预训练模型中,输出我们认为在用户选择属性上保持公平的用户向量:
u
k
=
f
s
e
q
(
s
u
k
∣
Θ
,
θ
k
)
=
h
u
,
m
1
+
m
+
∣
s
u
∣
L
,
k
u^k=f_{seq}(s^k_u|\Theta,\theta^k)=h^{L,k}_{u,m_1+m+|s_u|}
uk=fseq(suk∣Θ,θk)=hu,m1+m+∣su∣L,k其中在prompt-tuning阶段只有偏差消除器的参数被更新,而预训练模型则被固定。
判别器。判别器的作用是用来判断经过偏差消除器后的用户表示是否足够公平。即实现一个分类,如果一个偏差消除器生成的用户向量无法被判别器准确猜测出用户向量对应的属性,则此向量可以被认为在这种用户属性上具有公平性。
L
k
G
∗
,
D
∗
=
min
ϕ
k
max
θ
k
∑
B
∑
u
∈
B
∑
a
i
∈
Q
k
−
E
u
k
[
l
o
g
(
P
(
a
i
∣
u
k
,
ϕ
k
)
)
]
L^{G^*,D^*}_k=\min_{\phi^k} \max_{\theta^k} \sum_B \sum_{u \in B}\sum_{a_i \in Q_k}-E_{u^k}[log(P(a_i|u^k,\phi^k))]
LkG∗,D∗=ϕkminθkmaxB∑u∈B∑ai∈Qk∑−Euk[log(P(ai∣uk,ϕk))]