上一节介绍了受限玻尔兹曼机中随机变量节点的后验概率,本节将介绍随机变量结点的边缘概率。
已知受限玻尔兹曼机示例表示如下:
将随机变量集合
X
∈
R
p
\mathcal X \in \mathbb R^p
X∈Rp分成观测变量
v
v
v和隐变量
h
h
h两个部分:
X
=
(
x
1
,
x
2
,
⋯
,
x
p
)
T
=
(
h
v
)
p
×
1
{
h
=
(
h
1
,
h
2
,
⋯
,
h
m
)
m
×
1
T
v
=
(
v
1
,
v
2
,
⋯
,
v
n
)
n
×
1
T
m
+
n
=
p
\mathcal X = (x_1,x_2,\cdots,x_p)^T = (hv)
并且观测变量
v
v
v、隐变量
h
h
h中的每一个随机变量均服从伯努利分布:
h
j
(
j
=
1
,
2
,
⋯
,
m
)
∈
{
0
,
1
}
v
i
(
i
=
1
,
2
,
⋯
,
n
)
∈
{
0
,
1
}
hj(j=1,2,⋯,m)∈{0,1}vi(i=1,2,⋯,n)∈{0,1}
基于该模型,随机变量集合
X
\mathcal X
X的联合概率分布表示如下:
P
(
X
)
=
P
(
v
,
h
)
=
1
Z
exp
{
−
E
(
h
,
v
)
}
=
1
Z
exp
(
v
T
W
h
+
b
T
v
+
c
T
h
)
=
1
Z
exp
[
∑
j
=
1
m
∑
i
=
1
n
v
i
⋅
w
i
j
⋅
h
j
+
∑
i
=
1
n
b
i
v
i
+
∑
j
=
1
m
c
j
h
j
]
P(X)=P(v,h)=1Zexp{−E(h,v)}=1Zexp(vTWh+bTv+cTh)=1Zexp[m∑j=1n∑i=1vi⋅wij⋅hj+n∑i=1bivi+m∑j=1cjhj]
再写一遍~
化简目标是:将
P
(
v
,
h
)
\mathcal P(v,h)
P(v,h)中关于隐变量
h
h
h中的项积分掉,使其变为‘仅包含观测变量’
v
v
v的式子。
为了方便观看,将
v
i
(
i
=
1
,
2
,
⋯
,
n
)
v_i(i=1,2,\cdots,n)
vi(i=1,2,⋯,n)的部分进行合并
对
1
+
exp
(
W
j
T
v
+
c
j
)
1 + \exp(\mathcal W_j^Tv + c_j)
1+exp(WjTv+cj)进行变形,将
l
o
g
log
log函数引入,从而使
exp
,
log
\exp,\log
exp,log相互抵消。
将
e
x
p
exp
exp提出来,最终有:
观察上式中的
log
[
1
+
exp
(
W
j
T
v
+
c
j
)
]
\log[1 + \exp(\mathcal W_j^T v + c_j)]
log[1+exp(WjTv+cj)]部分,它实际上就是softplus的表现形式:
Softplus
(
x
)
=
log
[
1
+
exp
(
x
)
]
\text{Softplus}(x) = \log [1 + \exp(x)]
Softplus(x)=log[1+exp(x)]
Softplus
\text{Softplus}
Softplus函数图像表示如下:
Softplus也是一种激活函数,它可看做是ReLU函数的平滑效果,其值域为
(
0
,
∞
)
(0,\infty)
(0,∞)(不含0)。并且不会像ReLU函数产生神经元挂掉情况。
并且更值得一提的属性是,Softplus函数的导数是Sigmoid函数:
∂
Softplus
(
x
)
∂
x
=
exp
(
x
)
exp
(
x
)
+
1
=
1
1
+
1
exp
(
x
)
=
1
1
+
exp
(
−
x
)
∂ Softplus(x)∂x=exp(x)exp(x)+1=11+1exp(x)=11+exp(−x)
因而上述公式可最终化简为:
W
j
\mathcal W_j
Wj表示
W
\mathcal W
W矩阵第
j
j
j行的行向量。
P
(
v
)
=
1
Z
exp
{
b
T
v
+
∑
j
=
1
m
Softplus
(
W
j
T
v
+
c
j
)
}
\mathcal P(v) = \frac{1}{\mathcal Z} \exp \{b^Tv + \sum_{j=1}^m \text{Softplus}(\mathcal W_j^T v + c_j)\}
P(v)=Z1exp{bTv+j=1∑mSoftplus(WjTv+cj)}
至此,受限玻尔兹曼机介绍结束(Learning问题的坑后续补)。下一节将介绍配分函数(Partition Function)。
相关参考:
机器学习-受限玻尔兹曼机(6)-模型推断(Inference)-边缘概率
速用笔记 | Sigmoid/Tanh/ReLu/Softplus 激活函数的图形、表达式、导数、适用条件