一般定义:
设 X 是概率空间 ( Ω , F , P ) 中的随机变量 ( 三个参数分别表示样本空间 , 样本空间幂集的非空子集 , 概率 ) E ( X ) = ∫ Ω X d P 不是所有随机变量都有期望值 ( 上述积分不存在 , 则没有期望值 ) 如果 2 个随机变量的分布相同 , 期望也相同 设X是概率空间(\Omega,F,P)中的随机变量 \\(三个参数分别表示样本空间,样本空间幂集的非空子集,概率) \\ E(X)=\int\limits_{\Omega}X\mathrm{d}P \\不是所有随机变量都有期望值(上述积分不存在,则没有期望值) \\如果2个随机变量的分布相同,期望也相同 设X是概率空间(Ω,F,P)中的随机变量(三个参数分别表示样本空间,样本空间幂集的非空子集,概率)E(X)=Ω∫XdP不是所有随机变量都有期望值(上述积分不存在,则没有期望值)如果2个随机变量的分布相同,期望也相同
P
(
x
<
X
⩽
x
+
Δ
x
)
=
F
(
x
+
Δ
x
)
−
F
(
x
)
=
∫
x
x
+
Δ
x
f
(
x
)
d
x
≈
f
(
x
)
d
x
这个式子表明
,
f
(
x
)
d
x
是
X
取值落在
x
处邻域内概率的估计
P(x
下面讨论的一维和二维情况,都可以理解为是对应维数**随机变量的函数**的期望的特例
设随机变量X的分布律为
P ( X = x i ) = p i , i = 1 , 2 , ⋯ P(X=x_i)=p_i,i=1,2,\cdots P(X=xi)=pi,i=1,2,⋯
级数 E ( X ) = ∑ i = 1 + ∞ x k p k 绝对收敛 级数E(X)=\sum\limits_{i=1}^{+\infin}x_kp_k绝对收敛 级数E(X)=i=1∑+∞xkpk绝对收敛
即: E ( ∣ X ∣ ) = ∑ i = 1 + ∞ ∣ x k ∣ p k < + ∞ E(|X|)=\sum\limits_{i=1}^{+\infin}|x_k|p_k<+\infin E(∣X∣)=i=1∑+∞∣xk∣pk<+∞
其中: p k = P ( X = x k ) p_k=P(X=x_k) pk=P(X=xk)
否则随机变量X的期望不存在
则 E ( X ) 为随机变量的数学期望 ( 均值 ) 则E(X)为随机变量的数学期望(均值) 则E(X)为随机变量的数学期望(均值)
可以看出,当X可能取有限个值时,那么数学期望一定存在
对于无穷中取值可能,绝对收敛就体现出作用
设 f ( x ) 为概率密度 , 如果 设f(x)为概率密度,如果 设f(x)为概率密度,如果
E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x 绝对收敛 , 即 ∫ − ∞ + ∞ ∣ x ∣ f ( x ) d x < + ∞ 则称 E ( X ) 为随机变量 X 的数学期望 E(X)=\int_{-\infin}^{+\infin}xf(x)dx绝对收敛, \\即\int_{-\infin}^{+\infin}|x|f(x)dx<+\infin \\ 则称E(X)为随机变量X的数学期望 E(X)=∫−∞+∞xf(x)dx绝对收敛,即∫−∞+∞∣x∣f(x)dx<+∞则称E(X)为随机变量X的数学期望
随机变量函数的密度函数(或分布律)不一定要求出来
下面两个计算公式提供了简便计算随机变量函数Z=g(X)的期望的途径
它们的证明需要专业知识
利用这两个公式,可以避开对随机变量Z的分布律(或者密度函数的求解)
直接使用 X 的分布律 ( 密度函数就可以计算出 Z = g ( X ) 的期望 E ( Z ) ) 直接使用X的分布律(密度函数就可以计算出Z=g(X)的期望E(Z)) 直接使用X的分布律(密度函数就可以计算出Z=g(X)的期望E(Z))
记 Z = g ( X , Y ) 记Z=g(X,Y) 记Z=g(X,Y)
E ( Z ) = ∑ i = 1 + ∞ ∑ j = 1 + ∞ g ( x i , y i ) p i j E(Z)=\sum\limits_{i=1}^{+\infin}\sum\limits_{j=1}^{+\infin}g(x_i,y_i)p_{ij} E(Z)=i=1∑+∞j=1∑+∞g(xi,yi)pij
如果 E ( Z ) 绝对收敛 , 则随机变量 Z = g ( X , Y ) 的数学期望为 E ( Z ) 如果E(Z)绝对收敛,则随机变量Z=g(X,Y)的数学期望为E(Z) 如果E(Z)绝对收敛,则随机变量Z=g(X,Y)的数学期望为E(Z)
二维随机变量(函数)的期望
Z = g ( X , Y ) Z=g(X,Y) Z=g(X,Y)
E ( Z ) = E ( g ( X , Y ) ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y E(Z)=E(g(X,Y))=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)\mathrm{d}x\mathrm{d}y E(Z)=E(g(X,Y))=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
C 是常数 X , Y 是随机变量 C是常数 \\X,Y是随机变量 C是常数X,Y是随机变量
常数相关的的期望,容易由期望公式推导
E ( C ) = C E(C)=C E(C)=C
E ( C X ) = C E ( X ) E(CX)=CE(X) E(CX)=CE(X)
E ( X ± Y ) = E ( X ) ± E ( Y ) E(X\pm{Y})=E(X)\pm{E(Y)} E(X±Y)=E(X)±E(Y)
导出性质:
E ( a X + b ) = a E ( X ) + b E(aX+b)=aE(X)+b E(aX+b)=aE(X)+b
E ( X ‾ ) = E ( X ) ‾ E(\overline{X})=\overline{E(X)} E(X)=E(X)
X,Y不相关(或者相互独立)时
E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
记号说明
由独立性 : f ( x , y ) = f X ( x ) f Y ( y ) E ( X Y ) = ∬ x ∈ R 2 x y f ( x , y ) d x = ∬ x ∈ R 2 x y f X ( x ) f Y ( y ) d x = ( ∫ − ∞ + ∞ x f ( x , y ) d x ) ( ∫ − ∞ + ∞ y f ( x , y ) d y ) = E ( X ) E ( Y ) 由独立性:f(x,y)=f_X(x)f_Y(y) \\E(XY)=\iint\limits_{x\in{R^2}}xyf(x,y)\mathrm{d}x =\iint\limits_{x\in{R^2}}xyf_X(x)f_Y(y)\mathrm{d}x \\= \left( \int_{-\infin}^{+\infin}{xf(x,y)}\mathrm{d}x \right) \left( \int_{-\infin}^{+\infin}{yf(x,y)}\mathrm{d}y \right) \\=E(X)E(Y) 由独立性:f(x,y)=fX(x)fY(y)E(XY)=x∈R2∬xyf(x,y)dx=x∈R2∬xyfX(x)fY(y)dx=(∫−∞+∞xf(x,y)dx)(∫−∞+∞yf(x,y)dy)=E(X)E(Y)
D ( X ) = E ( ( X − E ( X ) ) 2 ) D(X)=E((X-E(X))^2) D(X)=E((X−E(X))2)
也就是二阶中心矩
X 的方差可以用 D ( x ) 或者 V a r ( X ) 表示 X的方差可以用D(x)或者Var(X)表示 X的方差可以用D(x)或者Var(X)表示
方差实际是有 X 的函数 g ( X ) 的期望 方差实际是有X的函数g(X)的期望 方差实际是有X的函数g(X)的期望
μ X = E ( X ) \mu_X=E(X) μX=E(X)视为常数🎈
Y = g ( X ) = ( X − E ( X ) ) 2 = ( X − μ X ) 2 Y=g(X)=(X-E(X))^2=(X-\mu_X)^2 Y=g(X)=(X−E(X))2=(X−μX)2
E ( ( X − E ( X ) ) 2 ) = E ( ( x k − μ X ) 2 ) E((X-E(X))^2)=E((x_k-\mu_X)^2) E((X−E(X))2)=E((xk−μX)2)
D ( X ) = E ( g ( X ) ) = ∑ k = 1 ∞ g ( x k ) p k = ∑ k = 1 ∞ ( x k − μ X ) 2 p k D(X)=E(g(X))=\sum\limits_{k=1}^{\infin}g(x_k)p_k =\sum\limits_{k=1}^{\infin}(x_k-\mu_X)^2p_k D(X)=E(g(X))=k=1∑∞g(xk)pk=k=1∑∞(xk−μX)2pk
D ( X ) = E ( g ( X ) ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x = ∫ − ∞ + ∞ ( x − μ X ) 2 f ( x ) d x D(X)=E(g(X))=\int_{-\infin}^{+\infin}g(x)f(x)\mathrm{d}x \\=\int_{-\infin}^{+\infin}(x-E(X))^2f(x)\mathrm{d}x \\=\int_{-\infin}^{+\infin}(x-\mu_{X})^2f(x)\mathrm{d}x D(X)=E(g(X))=∫−∞+∞g(x)f(x)dx=∫−∞+∞(x−E(X))2f(x)dx=∫−∞+∞(x−μX)2f(x)dx
D ( X ) = E ( X 2 ) − E 2 ( X ) D(X)=E(X^2)-E^2(X) D(X)=E(X2)−E2(X)
由于 D ( X ) ⩾ 0 由于D(X)\geqslant 0 由于D(X)⩾0
C 是常数 X , Y 是随机变量 C是常数 \\X,Y是随机变量 C是常数X,Y是随机变量
D ( C ) = 0 D(C)=0 D(C)=0
D ( a X + b ) = a 2 D ( X ) D(aX+b)=a^2D(X) D(aX+b)=a2D(X)
如果X,Y不相关(或独立)
更一般的,有
方差和概率的关系:
D ( X ) = 0 的充要条件是 : D(X)=0的充要条件是: D(X)=0的充要条件是:
P ( X = E ( X ) ) = 1 P(X=E(X))=1 P(X=E(X))=1
X 以概率 1 取得常数 E ( X ) , 即 X 的取值只有 E ( X ) , 这样一来 , 保证没有点偏离 E ( X ) X以概率1取得常数E(X),即X的取值只有E(X),这样一来,保证没有点偏离E(X) X以概率1取得常数E(X),即X的取值只有E(X),这样一来,保证没有点偏离E(X)
充分性 : P ( X = E ( X ) ) = 1 ⇒ P ( X 2 = E 2 ( X ) ) = 1 设常数 E ( X ) = T ; 则 E 2 ( X ) = T 2 E ( X ) = ∑ i = 1 + ∞ x k p k = ∑ i = 1 + ∞ x k P ( X = x k ) Z = X 2 E ( X 2 ) = E ( Z ) = ∑ i = 1 + ∞ z k p k = ∑ i = 1 + ∞ z k P ( Z = z k ) = T 2 ⋅ P ( Z = T 2 ) = T 2 D ( X ) = E ( X 2 ) − E 2 ( X ) = T 2 − T 2 = 0 充分性: \\P(X=E(X))=1 \Rightarrow P(X^2=E^2(X))=1 \\设常数E(X)=T;则E^2(X)=T^2 \\E(X)=\sum\limits_{i=1}^{+\infin}x_kp_k =\sum\limits_{i=1}^{+\infin}x_kP(X=x_k) \\ Z=X^2 \\ E(X^2)=E(Z)=\sum\limits_{i=1}^{+\infin}z_kp_k =\sum\limits_{i=1}^{+\infin}z_kP(Z=z_k) \\=T^2\cdot P(Z=T^2)=T^2 \\ D(X)=E(X^2)-E^2(X)=T^2-T^2=0 充分性:P(X=E(X))=1⇒P(X2=E2(X))=1设常数E(X)=T;则E2(X)=T2E(X)=i=1∑+∞xkpk=i=1∑+∞xkP(X=xk)Z=X2E(X2)=E(Z)=i=1∑+∞zkpk=i=1∑+∞zkP(Z=zk)=T2⋅P(Z=T2)=T2D(X)=E(X2)−E2(X)=T2−T2=0
σ = 1 N ∑ i = 1 N ( x i − x ‾ ) 2 {\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}} σ=N1i=1∑N(xi−x)2
x ‾ {\overline {x}} x为平均值。
上述公式可以如下代换而简化:
方差公式变形
$$
\begin{align}
\sum_{i=1}^N (X_i - \mu)^2 & = {} \sum_{i=1}^N (X_i^2 - 2 X_i\mu + \mu^2) \
& {} = \left(\sum_{i=1}^N X_i^2\right) - \left(2 \mu \sum_{i=1}^N X_i\right) + N\mu^2 \
& {} = \left(\sum_{i=1}^N X_i^2\right) - 2 \mu (N\mu) + N\mu^2 \
& {} = \left(\sum_{i=1}^N X_i^2\right) - 2N\mu^2 + N\mu^2 \
& {} = \left(\sum_{i=1}^N X_i^2\right) - N\mu^2
\end{align}
$$
所以:
根号里面,亦即方差( σ 2 \sigma^2 σ2)的简易口诀为:“平方和的平均”减去“平均的平方”。