补充:
《程序员的数学2概率统计》一书中1.3章节。
将概率问题比喻成了一个个平行世界的组合,使用希腊字母小写 ω \omega ω表示具体每一个世界,使用希腊字母大写 Ω \Omega Ω表示所有平行世界组成的大集合。
Ω \Omega Ω的子集A(如果不习惯这个词,可以理解为 Ω \Omega Ω中的区域A)的面积将由 P ( A ) P(A) P(A)表示。
简单来说,对于取值不确定的随机值,将其可能的平均值称为期望值,值的分散情况称为方差。
随机变量记为 X X X,期望值记为 E [ X ] E[X] E[X]。
假设有A、B、C三种情况,概率分别
1
6
\dfrac{1}{6}
61,
1
3
\dfrac{1}{3}
31,
1
2
\dfrac{1}{2}
21,三种情况的概率之和为1(实际全部情况的概率之和为1),现在将ABC三种情况理解为一个正方形中的三个区域。不同的概率分别是各自的面积大小,而正方形整体的面积为1。
假设A区域的随机数=5,B区域的随机数=2,A区域的随机数=1,将每个区域出现的值作为高度绘图,就可以得到如下快状体。
将上图右侧块状体的体积称为期望值,记为
E
[
X
]
E[X]
E[X]。则期望值的计算过程如下
E [ X ] = 5 ∗ 1 6 + 2 ∗ 1 3 + 1 ∗ 1 2 = 2 E[X] = 5*\dfrac{1}{6}+2*\dfrac{1}{3}+1*\dfrac{1}{2} = 2 E[X]=5∗61+2∗31+1∗21=2
将期望值理解为所有平行世界的平均值。通过雪国的故事或许可以帮助读者理解这个概念。假设 Ω \Omega Ω国有A、B、C三个省份,各省的面积分别为 1 6 \dfrac{1}{6} 61, 1 3 \dfrac{1}{3} 31, 1 2 \dfrac{1}{2} 21,全国的总面积为1。某一天, Ω \Omega Ω国下雪了,A、B、C省的积雪分别是5m、3m、1m。现在想要计算全国的平均积雪情况。也就是说,如果将学铺满整个国家后积雪将有多深呢?答案是 E ( X ) E(X) E(X),则 E ( X ) E(X) E(X)的计算如下
E [ X ] = 5 ∗ 1 6 + 2 ∗ 1 3 + 1 ∗ 1 2 1 = 2 E[X] = \dfrac{5*\dfrac{1}{6}+2*\dfrac{1}{3}+1*\dfrac{1}{2}}{1} = 2 E[X]=15∗61+2∗31+1∗21=2
方差即“期望值离散程度”的期望值
假设随机变量 X X X的期望值 E [ X ] = μ E[X]=\mu E[X]=μ。习惯上,随机值 X X X以大写字母表示,它的期望值 μ \mu μ是一个定值,因此用小写字母表示。
由于
X
X
X是个一个随机变量,因此即使它的期望值为
μ
\mu
μ,也不表示它的值就一定等于
μ
\mu
μ。为此,需要计算它的实际取值
x
x
x与
μ
\mu
μ的差距。
测量的方式有很多。
∣
x
−
μ
∣
|x-\mu|
∣x−μ∣可能是最为直观的方法,但是在实际计算时,绝对值的存在会带来诸多不便。于是人们通常使用偏差的平方
(
x
−
μ
)
2
(x-\mu)^2
(x−μ)2而非绝对值来解决这个问题。
这些性质非常否和离散的程度。
不过,由于
X
X
X是一个随机值,直接计算
(
x
−
μ
)
2
(x-\mu)^2
(x−μ)2得到的也将是一个随机值,而我们希望得到的是一种固定指标,因此需要进一步计算它的期望值
E
[
(
x
−
μ
)
2
]
E[(x-\mu)^2]
E[(x−μ)2],来消除随机性。用这种方式得到的“离散程度的期望值”称为方差(variance),记为
V
[
X
]
V[X]
V[X]或
V
a
r
[
X
]
Var[X]
Var[X]。
方差用于衡量随机变量的离散程度。 V [ X ] V[X] V[X]的值越大,随机变量的值就越分散, 值越小,随机变量的值就越集中。但是对于 V [ X ] = 25 V[X]=25 V[X]=25和 V [ X ] = 100 V[X]=100 V[X]=100,是否能够想象其分散的程度呢?方差结果相差4倍,但是二者实际的分散程度是4倍吗?
通过方差的计算 ( x − μ ) 2 (x-\mu)^2 (x−μ)2可以得知,方差是平方后的结果,假设 X X X表示的是长度,方差 V [ X ] V[X] V[X]表示的是长度的平方,并不是长度,因此二者无法直接比较。
我们通常通过平方根运算将方差还原成长度。诸如此类的方差的平方根称为标准差(standard deviation),通常记为 σ \sigma σ或 s s s。
《程序员的数学2概率统计》笔记