定义:
设
X
X
X是随机变量,如果
E
(
X
k
)
,
k
=
1
,
2
,
⋯
E(X^{k}),k=1,2,\cdots
E(Xk),k=1,2,⋯
存在,则称之为
X
X
X的
k
k
k阶原点矩
设
X
X
X是随机变量,如果
E
{
[
X
−
E
(
X
)
]
k
}
,
k
=
1
,
2
,
3
,
⋯
E \left\{[X-E(X)]^{k}\right\},k=1,2,3,\cdots
E{[X−E(X)]k},k=1,2,3,⋯
存在,则称之为
X
X
X的
k
k
k阶中心矩
设
X
X
X和
Y
Y
Y是两个随机变量,如果
E
(
X
k
Y
l
)
,
k
,
l
=
1
,
2
,
⋯
E(X^{k}Y^{l}),k,l=1,2,\cdots
E(XkYl),k,l=1,2,⋯
存在,则称之为
X
X
X和
Y
Y
Y的
k
+
l
k+l
k+l阶混合矩
设
X
X
X和
Y
Y
Y是两个随机变量,如果
E
{
[
X
−
E
(
X
)
]
k
[
Y
−
E
(
Y
)
]
l
}
,
k
,
l
=
1
,
2
,
⋯
E \left\{[X-E(X)]^{k}[Y-E(Y)]^{l}\right\},k,l=1,2,\cdots
E{[X−E(X)]k[Y−E(Y)]l},k,l=1,2,⋯
存在,则称之为
X
X
X和
Y
Y
Y的
k
+
l
k+l
k+l阶混合中心矩
定义:对于随机变量
X
X
X和
Y
Y
Y,如果
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
E \left\{[X-E(X)][Y-E(Y)]\right\}
E{[X−E(X)][Y−E(Y)]}存在,则称之为
X
X
X和
Y
Y
Y的协方差,记作
cov
(
X
,
Y
)
\text{cov}(X,Y)
cov(X,Y),即
cov
(
X
,
Y
)
=
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
\text{cov}(X,Y)=E \left\{[X-E(X)][Y-E(Y)]\right\}
cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
例1:设随机变量 X 1 , X 2 , ⋯ , X n ( n > 1 ) X_{1},X_{2},\cdots ,X_{n}(n>1) X1,X2,⋯,Xn(n>1)相互独立,均服从正态分布 N ( 0 , σ 2 ) N(0,\sigma^{2}) N(0,σ2),则 cov ( X 1 , 1 n ∑ i = 1 n X i ) = ( ) \text{cov}(X_{1}, \frac{1}{n}\sum\limits_{i=1 }^{n}X_{i})=() cov(X1,n1i=1∑nXi)=()
注意此处 1 n ∑ i = 1 n X i ≠ E ( X )
n1i=1∑nXi=E(X)" role="presentation" style="position: relative;"> 1 n ∑ i = 1 n X i ≠ E ( X )
cov
(
X
1
,
1
n
∑
i
=
1
n
X
i
)
=
E
(
X
1
−
E
X
1
)
(
1
n
∑
i
=
1
n
X
i
−
1
n
∑
i
=
1
n
E
X
i
)
=
E
[
X
1
(
1
n
∑
i
=
1
n
X
i
)
]
=
1
n
E
(
X
1
∑
i
=
1
n
X
i
)
=
1
n
E
(
X
1
2
+
∑
i
=
2
n
X
1
X
i
)
=
1
n
(
σ
2
+
∑
i
=
2
n
0
)
=
σ
2
n
例2:箱中装有 6 6 6个球,其中红、白、黑球的个数分别为 1 , 2 , 3 1,2,3 1,2,3个,现从箱中随机地取出 2 2 2个球,记 X X X为取出红球的个数, Y Y Y为取出的白球个数,求 cov ( X , Y ) \text{cov}(X,Y) cov(X,Y)
| X X X \ Y Y Y | 0 0 0 | 1 1 1 | 2 2 2 | |
|---|---|---|---|---|
| 0 0 0 | 1 5 \frac{1}{5} 51 | 2 5 \frac{2}{5} 52 | 1 15 \frac{1}{15} 151 | 2 3 \frac{2}{3} 32 |
| 1 1 1 | 1 5 \frac{1}{5} 51 | 2 15 \frac{2}{15} 152 | 0 0 0 | 1 3 \frac{1}{3} 31 |
| 2 5 \frac{2}{5} 52 | 8 15 \frac{8}{15} 158 | 1 15 \frac{1}{15} 151 |
cov
(
X
,
Y
)
=
E
(
X
Y
)
−
E
(
X
)
⋅
E
(
Y
)
E
(
X
)
=
0
×
2
3
+
1
×
1
3
=
1
3
E
(
Y
)
=
0
×
2
5
+
1
×
8
15
+
2
×
1
15
=
2
3
E
(
X
Y
)
=
0
×
(
1
5
+
2
5
+
1
15
+
1
5
)
+
1
×
1
×
2
15
+
1
×
2
×
0
=
2
15
cov
(
X
,
Y
)
=
2
15
−
1
3
×
2
3
=
−
4
45
定义:随机变量
X
X
X和
Y
Y
Y,如果
D
(
X
)
D
(
Y
)
≠
0
D(X)D(Y)\ne 0
D(X)D(Y)=0,则称
cov
(
X
,
Y
)
D
(
X
)
D
(
Y
)
ρ
X
Y
=
cov
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
ρXY=D(X)D(Y)cov(X,Y)
如果
D
(
X
)
D
(
Y
)
=
0
D(X)D(Y)=0
D(X)D(Y)=0,则
ρ
X
Y
=
0
\rho_{XY}=0
ρXY=0
如果随机变量
X
X
X和
Y
Y
Y的相关系数
ρ
X
Y
=
0
\rho_{XY}=0
ρXY=0,则称
X
X
X和
Y
Y
Y不相关
个人理解,相关系数的意义,相关系数可写作
ρ = E ( X − E X ) ( Y − E ( Y ) ) D X D Y = E ( X − E X ) D X ⋅ E ( Y − E Y ) D Y \rho=\frac{E(X-EX)(Y-E(Y))}{\sqrt{DX}\sqrt{DY}}=\frac{E(X-EX)}{\sqrt{DX}}\cdot \frac{E(Y-EY)}{\sqrt{DY}} ρ=DXDYE(X−EX)(Y−E(Y))=DXE(X−EX)⋅DYE(Y−EY)
即两个变量标准化后的协方差。两变量的协方差如果很大,无法直接得到其是由于 E ( X ) E(X) E(X)或 E ( Y ) E(Y) E(Y)大导致,还是二者差异大导致,因此进行标准化
例3:随机试验 E E E有三种两两不相容的结果 A 1 , A 2 , A 3 A_{1},A_{2},A_{3} A1,A2,A3,且三种结果发生的概率均为 1 3 \frac{1}{3} 31,将试验 E E E独立重复做 2 2 2次, X X X表示 2 2 2次试验中结果 A 1 A_{1} A1发生的次数, Y Y Y表示 2 2 2次试验中结果 A 2 A_{2} A2发生的次数,则 X X X与 Y Y Y的相关系数为()
设
Z
Z
Z表示
2
2
2次试验中结果
A
3
A_{3}
A3发生的次数,试验是独立重复的,把
A
3
A_{3}
A3发生看成是试验成功,且
P
(
A
3
)
=
1
3
P(A_{3})=\frac{1}{3}
P(A3)=31,所以,随机变量
Z
Z
Z必服从二项分布
B
(
2
,
1
3
)
B(2, \frac{1}{3})
B(2,31),同理,
X
X
X和
Y
Y
Y也都服从
B
(
2
,
1
3
)
B(2, \frac{1}{3})
B(2,31),因此
D
X
=
D
Y
DX=DY
DX=DY
显然有
X
+
Y
+
Z
=
2
⇒
Y
=
2
−
X
−
Z
X+Y+Z=2 \Rightarrow Y=2-X-Z
X+Y+Z=2⇒Y=2−X−Z
因此
cov
(
X
,
Y
)
=
cov
(
X
,
2
−
X
−
Z
)
=
cov
(
X
,
2
)
−
cov
(
X
,
X
)
−
cov
(
X
,
Z
)
=
0
−
D
X
−
cov
(
X
,
Z
)
由对称性cov
(
X
,
Y
)
=
cov
(
X
,
Z
)
=
−
D
X
−
cov
(
X
,
Y
)
即
cov
(
X
,
Y
)
=
−
D
X
2
\text{cov}(X,Y)=- \frac{DX}{2}
cov(X,Y)=−2DX
则
X
X
X与
Y
Y
Y的相关系数
ρ
X
Y
=
cov
(
X
,
Y
)
D
X
D
Y
=
−
D
X
2
D
X
=
−
1
2
\rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{DX}\sqrt{DY}}=\frac{-\frac{DX}{2}}{DX}=- \frac{1}{2}
ρXY=DXDYcov(X,Y)=DX−2DX=−21
例4:设随机变量 X X X和 Y Y Y的概率分布分别为
| X X X | 0 0 0 | 1 1 1 |
|---|---|---|
| P P P | 1 3 \frac{1}{3} 31 | 2 3 \frac{2}{3} 32 |
| Y Y Y | − 1 -1 −1 | 0 0 0 | 1 1 1 |
|---|---|---|---|
| P P P | 1 3 \frac{1}{3} 31 | 1 3 \frac{1}{3} 31 | 1 3 \frac{1}{3} 31 |
且 P { X 2 = Y 2 } = 1 P \left\{X^{2}=Y^{2}\right\}=1 P{X2=Y2}=1
由 P { X 2 = Y 2 } = 1 P \left\{X^{2}=Y^{2}\right\}=1 P{X2=Y2}=1,得 P { X 2 ≠ Y 2 } = 0 P \left\{X^{2}\ne Y^{2}\right\}=0 P{X2=Y2}=0,因此有
| X X X\ P P P | − 1 -1 −1 | 0 0 0 | 1 1 1 | P i ⋅ P_{i \cdot } Pi⋅ |
|---|---|---|---|---|
| 0 0 0 | 0 0 0 | 0 0 0 | 1 3 \frac{1}{3} 31 | |
| 1 1 1 | 0 0 0 | 2 3 \frac{2}{3} 32 | ||
| P ⋅ j P_{\cdot j} P⋅j | 1 3 \frac{1}{3} 31 | 1 3 \frac{1}{3} 31 | 1 3 \frac{1}{3} 31 |
可得
| X X X\ P P P | − 1 -1 −1 | 0 0 0 | 1 1 1 | P i ⋅ P_{i \cdot } Pi⋅ |
|---|---|---|---|---|
| 0 0 0 | 0 0 0 | 1 3 \frac{1}{3} 31 | 0 0 0 | 1 3 \frac{1}{3} 31 |
| 1 1 1 | 1 3 \frac{1}{3} 31 | 0 0 0 | 1 3 \frac{1}{3} 31 | 2 3 \frac{2}{3} 32 |
| P ⋅ j P_{\cdot j} P⋅j | 1 3 \frac{1}{3} 31 | 1 3 \frac{1}{3} 31 | 1 3 \frac{1}{3} 31 |
显然存在
p
i
j
≠
p
i
⋅
p
⋅
j
p_{ij}\ne p_{i \cdot }p_{\cdot j}
pij=pi⋅p⋅j,因此
X
X
X与
Y
Y
Y不独立
又有
ρ
X
Y
=
cov
(
X
,
Y
)
D
X
D
Y
=
E
X
Y
−
E
X
⋅
E
Y
D
X
D
Y
=
0
−
2
3
×
0
D
X
D
Y
=
0
因此
X
X
X与
Y
Y
Y不相关,不独立
例5:已知随机变量 ( X , Y ) (X,Y) (X,Y)服从二维正态分布 N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; 0 ) N(\mu_{1},\mu_{2};\sigma_{1}^{2},\sigma_{2}^{2};0) N(μ1,μ2;σ12,σ22;0),记 Z 1 = X + Y Z_{1}=X+Y Z1=X+Y和 Z 2 = X − Y Z_{2}=X-Y Z2=X−Y
由于
∣
1
1
1
−
1
∣
≠
0
因此
(
Z
1
,
Z
2
)
=
(
X
+
Y
,
X
−
Y
)
(Z_{1},Z_{2})=(X+Y,X-Y)
(Z1,Z2)=(X+Y,X−Y)服从二维正态
D
(
Z
1
)
=
D
(
X
+
Y
)
=
D
X
+
D
Y
=
σ
1
2
+
σ
2
2
D
(
Z
2
)
=
D
(
X
−
Y
)
=
D
X
+
D
Y
=
σ
1
2
+
σ
2
2
cov
(
Z
1
,
Z
2
)
=
cov
(
X
+
Y
,
X
−
Y
)
=
cov
(
X
,
X
)
−
cov
(
X
,
Y
)
+
cov
(
Y
,
X
)
−
cov
(
Y
,
Y
)
=
σ
1
2
−
σ
2
2
ρ
Z
1
,
Z
2
=
cov
(
Z
1
,
Z
2
)
D
Z
1
D
Z
2
=
σ
1
2
−
σ
2
2
σ
1
2
+
σ
2
2
因此
(
Z
1
,
Z
2
)
∼
N
(
μ
1
+
μ
2
,
μ
1
−
μ
2
;
σ
1
2
+
σ
2
2
,
σ
1
2
−
σ
2
2
;
σ
1
2
−
σ
2
2
σ
1
2
+
σ
2
2
)
当
σ
1
=
σ
2
\sigma_{1}=\sigma_{2}
σ1=σ2时,
ρ
Z
1
Z
2
=
0
⇒
当
σ
1
≠
σ
2
\sigma_{1}\ne \sigma_{2}
σ1=σ2时,
ρ
Z
1
Z
2
≠
0
⇒
( X , Y ) (X,Y) (X,Y)是正态时,不相关与独立等价
( X , Y ) (X,Y) (X,Y)正态时, X X X与 Y Y Y必正态,反之不一定
X X X与 Y Y Y均正态且相互独立,则 ( X , Y ) (X,Y) (X,Y)必正态
( X , Y ) (X,Y) (X,Y)正态的充要条件为 ∣ a b c d ∣ ≠ 0\ne 0 ∣ ∣acbd∣ ∣=0时, ( a X + b Y , c X + d Y ) (aX+bY,cX+dY) (aX+bY,cX+dY)为正态" role="presentation" style="position: relative;"> | a b c d |
例6:设随机变量
(
X
,
Y
)
(X,Y)
(X,Y)服从二维正态分布
N
(
0
,
0
;
1
,
4
;
−
1
2
)
显然
X
∼
N
(
0
,
1
)
,
Y
∼
(
0
,
4
)
X \sim N(0,1),Y \sim (0,4)
X∼N(0,1),Y∼(0,4)
cov
(
X
,
Y
)
=
ρ
D
X
D
Y
=
−
1
D
(
X
+
Y
)
=
D
X
+
D
Y
+
2
cov
(
X
,
Y
)
=
3
注意这里 D ( X + Y ) ≠ D X + D Y D(X+Y)\ne DX+DY D(X+Y)=DX+DY,由于没有 X , Y X,Y X,Y相互独立的条件
E
[
3
3
(
X
+
Y
)
]
=
3
3
(
E
X
+
E
Y
)
=
0
D
[
3
3
(
X
+
Y
)
]
=
3
3
2
D
(
X
+
Y
)
=
1
cov
(
3
3
(
X
+
Y
)
,
X
)
=
3
3
[
cov
(
X
,
X
)
+
cov
(
Y
,
X
)
]
=
0
ρ
3
3
(
X
+
Y
)
,
X
=
0
由于
∣
3
3
3
3
1
0
∣
≠
0
因此
(
3
3
(
X
+
Y
)
,
X
)
CSDN话题挑战赛第2期
参赛话题:学习笔记