先来一个问题:一机器在良好的状态生产合格产品几率为90%,在故障状态生产合格产品几率是30%,机器良好的概率是75%,若一日第一件产品是合格的,那么此日机器良好的概率是多少?
这里需要用到贝叶斯公式, 贝叶斯公式一点也不神秘,首先我们要是觉得两个东西有关联,那么它们就有联合概率
P
(
A
,
B
)
P(A,B)
P(A,B),联合概率可以用链式法则表示为:
P
(
A
,
B
)
=
P
(
A
∣
B
)
P
(
B
)
P(A,B) = P(A|B)P(B)
P(A,B)=P(A∣B)P(B)
这个是大家都学习过的条件概率,
A
A
A和
B
B
B同时发生的概率是B发生的概率乘以B发生下A的条件概率。反过来一样成立。所以有:
P
(
A
,
B
)
=
P
(
A
∣
B
)
P
(
B
)
=
P
(
B
∣
A
)
P
(
A
)
P(A,B) = P(A|B)P(B) = P(B|A)P(A)
P(A,B)=P(A∣B)P(B)=P(B∣A)P(A)
两边同时除以
P
(
B
)
P(B)
P(B)得:
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
B
)
P(A|B) = \frac{P(A)P(B|A)}{P(B)}
P(A∣B)=P(B)P(A)P(B∣A)
这就是贝叶斯公式,所以贝叶斯公式应用范围非常广,只要两个东西有关联,能写出联合概率,那么就可以用贝叶斯公式。
机器有良好和故障两种状态,用
A
A
A表示,产品有合格和不合格两种状态,用
B
B
B表示。
直接套用公式算一波:
P
(
A
=
良
好
∣
B
=
合
格
)
=
P
(
A
=
良
好
)
P
(
B
=
合
格
∣
A
=
良
好
)
P
(
B
=
合
格
)
P(A = 良好|B = 合格) = \frac{P(A = 良好)P(B = 合格 | A = 良好)}{P(B = 合格)}
P(A=良好∣B=合格)=P(B=合格)P(A=良好)P(B=合格∣A=良好)
P
(
B
=
合
格
)
P(B = 合格)
P(B=合格)的概率等于:
P
(
B
=
合
格
)
=
P
(
B
=
合
格
∣
A
=
良
好
)
P
(
A
=
良
好
)
+
P
(
B
=
合
格
∣
A
=
故
障
)
P
(
A
=
故
障
)
P(B = 合格) = P(B = 合格 | A = 良好)P(A = 良好) + P(B = 合格 | A = 故障)P(A = 故障)
P(B=合格)=P(B=合格∣A=良好)P(A=良好)+P(B=合格∣A=故障)P(A=故障)
所以:
P
(
A
∣
B
)
=
P
(
A
=
良
好
)
P
(
B
=
合
格
∣
A
=
良
好
)
P
(
B
=
合
格
)
=
0.7
∗
0.9
0.75
∗
0.9
+
0.25
∗
0.3
=
0.9
P(A|B) = \frac{P(A = 良好)P(B = 合格|A = 良好)}{P(B = 合格)} = \frac{0.7*0.9}{0.75*0.9 + 0.25*0.3} = 0.9
P(A∣B)=P(B=合格)P(A=良好)P(B=合格∣A=良好)=0.75∗0.9+0.25∗0.30.7∗0.9=0.9
知乎上回答给出了一个很好的图:

问题要求机器良好的概率 = =左下角那个蓝色方格的面积/所有蓝色部分的面积,是不是很好懂?。
先验概率是一般情况下机器良好的概率0.75(蓝色面积/总面积),在得知当天有合格产品产出后,灰色面积就没可能了,经过贝叶斯定律的计算后,就得到后验概率0.9(左下角蓝色面积/蓝色总面积)。
贝叶斯公式的适用范围不只有两个事件A和B,也可以是参数
θ
\theta
θ和数据data->P(data|
θ
\theta
θ).,,,随着学习的越多,越容易感受到贝叶斯公式的神奇魅力。
慢慢的将贝叶斯公式全部将其搞定都行啦的回事与打算。
慢慢的将其全部都研究透彻,研究彻底!
全部将其搞定!
慢慢的将贝叶斯公式全部都搞透彻!
慢慢的将各种的贝叶斯公式,全部将其搞清楚,慢慢的梳理清楚都行啦的样子学会整理都行啦的理由与打算。