公式:
L
=
−
∑
i
y
i
⋅
l
o
g
(
p
i
)
L=-\sum _i y_i \cdot log(p_i)
L=−i∑yi⋅log(pi)
其中 y i y_i yi 为人工标注的, p i p_i pi 为预测的概率;
公式:
H
p
(
q
)
=
−
1
N
[
∑
i
=
1
N
y
i
⋅
l
o
g
(
p
(
y
i
)
)
+
(
1
−
y
i
)
⋅
l
o
g
(
1
−
p
(
y
i
)
)
]
H_{p(q)}=-\frac{1}{N}[\sum^N_{i=1}y_i \cdot log(p(y_i))+(1-y_i) \cdot log(1-p(y_i))]
Hp(q)=−N1[i=1∑Nyi⋅log(p(yi))+(1−yi)⋅log(1−p(yi))]
[
]
[ ]
[]里面表示的是单个样本分别预测正样本和负样本的概率。

目的:解决正负样本不平衡的问题。

(
1
−
p
)
γ
(1-p)^\gamma
(1−p)γ用于难样本的挖掘,如一个样本预测正样本的概率较低,则
(
1
−
p
)
γ
(1-p)^\gamma
(1−p)γ会加大正样本的权重,
p
γ
p^\gamma
pγ会减少负样本的权重;