• 【概率论基础进阶】随机变量的数字特征-矩、协方差和相关系数


    定义:
    X X X是随机变量,如果
    E ( X k ) , k = 1 , 2 , ⋯ E(X^{k}),k=1,2,\cdots E(Xk),k=1,2,
    存在,则称之为 X X X k k k阶原点矩

    X X X是随机变量,如果
    E { [ X − E ( X ) ] k } , k = 1 , 2 , 3 , ⋯ E \left\{[X-E(X)]^{k}\right\},k=1,2,3,\cdots E{[XE(X)]k},k=1,2,3,
    存在,则称之为 X X X k k k阶中心矩

    X X X Y Y Y是两个随机变量,如果
    E ( X k Y l ) , k , l = 1 , 2 , ⋯ E(X^{k}Y^{l}),k,l=1,2,\cdots E(XkYl),k,l=1,2,
    存在,则称之为 X X X Y Y Y k + l k+l k+l阶混合矩

    X X X Y Y Y是两个随机变量,如果
    E { [ X − E ( X ) ] k [ Y − E ( Y ) ] l } , k , l = 1 , 2 , ⋯ E \left\{[X-E(X)]^{k}[Y-E(Y)]^{l}\right\},k,l=1,2,\cdots E{[XE(X)]k[YE(Y)]l},k,l=1,2,
    存在,则称之为 X X X Y Y Y k + l k+l k+l阶混合中心矩

    协方差

    定义:对于随机变量 X X X Y Y Y,如果 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } E \left\{[X-E(X)][Y-E(Y)]\right\} E{[XE(X)][YE(Y)]}存在,则称之为 X X X Y Y Y的协方差,记作 cov ( X , Y ) \text{cov}(X,Y) cov(X,Y),即
    cov ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } \text{cov}(X,Y)=E \left\{[X-E(X)][Y-E(Y)]\right\} cov(X,Y)=E{[XE(X)][YE(Y)]}

    计算公式

    • cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) \text{cov}(X,Y)=E(XY)-E(X)E(Y) cov(X,Y)=E(XY)E(X)E(Y)
    • D ( X ± Y ) = D ( X ) + D ( Y ) ± cov ( X , Y ) D(X \pm Y)=D(X)+D(Y)\pm \text{cov}(X,Y) D(X±Y)=D(X)+D(Y)±cov(X,Y)

    性质

    • cov ( X , Y ) = cov ( X , Y ) \text{cov}(X,Y)=\text{cov}(X,Y) cov(X,Y)=cov(X,Y)
    • cov ( a X , b Y ) = a b cov ( X , Y ) \text{cov}(aX,bY)=ab \text{cov}(X,Y) cov(aX,bY)=abcov(X,Y),其中 a , b a,b a,b是常数
    • cov ( X 1 + X 2 , Y ) = cov ( X 1 , Y ) + cov ( X 2 , Y ) \text{cov}(X_{1}+X_{2},Y)=\text{cov}(X_{1},Y)+\text{cov}(X_{2},Y) cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)

    例1:设随机变量 X 1 , X 2 , ⋯   , X n ( n > 1 ) X_{1},X_{2},\cdots ,X_{n}(n>1) X1,X2,,Xn(n>1)相互独立,均服从正态分布 N ( 0 , σ 2 ) N(0,\sigma^{2}) N(0,σ2),则 cov ( X 1 , 1 n ∑ i = 1 n X i ) = ( ) \text{cov}(X_{1}, \frac{1}{n}\sum\limits_{i=1 }^{n}X_{i})=() cov(X1,n1i=1nXi)=()

    注意此处 1 n ∑ i = 1 n X i ≠ E ( X )

    1ni=1nXiE(X)" role="presentation" style="position: relative;">1ni=1nXiE(X)
    n1i=1nXi=E(X)

    cov ( X 1 , 1 n ∑ i = 1 n X i ) = E ( X 1 − E X 1 ) ( 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E X i ) = E [ X 1 ( 1 n ∑ i = 1 n X i ) ] = 1 n E ( X 1 ∑ i = 1 n X i ) = 1 n E ( X 1 2 + ∑ i = 2 n X 1 X i ) = 1 n ( σ 2 + ∑ i = 2 n 0 ) = σ 2 n

    cov(X1,1ni=1nXi)=E(X1EX1)(1ni=1nXi1ni=1nEXi)=E[X1(1ni=1nXi)]=1nE(X1i=1nXi)=1nE(X12+i=2nX1Xi)=1n(σ2+i=2n0)=σ2n" role="presentation" style="position: relative;">cov(X1,1ni=1nXi)=E(X1EX1)(1ni=1nXi1ni=1nEXi)=E[X1(1ni=1nXi)]=1nE(X1i=1nXi)=1nE(X12+i=2nX1Xi)=1n(σ2+i=2n0)=σ2n
    cov(X1,n1i=1nXi)=E(X1EX1)(n1i=1nXin1i=1nEXi)=E[X1(n1i=1nXi)]=n1E(X1i=1nXi)=n1E(X12+i=2nX1Xi)=n1(σ2+i=2n0)=nσ2

    例2:箱中装有 6 6 6个球,其中红、白、黑球的个数分别为 1 , 2 , 3 1,2,3 1,2,3个,现从箱中随机地取出 2 2 2个球,记 X X X为取出红球的个数, Y Y Y为取出的白球个数,求 cov ( X , Y ) \text{cov}(X,Y) cov(X,Y)

    X X X \ Y Y Y 0 0 0 1 1 1 2 2 2
    0 0 0 1 5 \frac{1}{5} 51 2 5 \frac{2}{5} 52 1 15 \frac{1}{15} 151 2 3 \frac{2}{3} 32
    1 1 1 1 5 \frac{1}{5} 51 2 15 \frac{2}{15} 152 0 0 0 1 3 \frac{1}{3} 31
    2 5 \frac{2}{5} 52 8 15 \frac{8}{15} 158 1 15 \frac{1}{15} 151

    cov ( X , Y ) = E ( X Y ) − E ( X ) ⋅ E ( Y ) E ( X ) = 0 × 2 3 + 1 × 1 3 = 1 3 E ( Y ) = 0 × 2 5 + 1 × 8 15 + 2 × 1 15 = 2 3 E ( X Y ) = 0 × ( 1 5 + 2 5 + 1 15 + 1 5 ) + 1 × 1 × 2 15 + 1 × 2 × 0 = 2 15 cov ( X , Y ) = 2 15 − 1 3 × 2 3 = − 4 45

    cov(X,Y)=E(XY)E(X)E(Y)E(X)=0×23+1×13=13E(Y)=0×25+1×815+2×115=23E(XY)=0×(15+25+115+15)+1×1×215+1×2×0=215cov(X,Y)=21513×23=445" role="presentation" style="position: relative;">cov(X,Y)=E(XY)E(X)E(Y)E(X)=0×23+1×13=13E(Y)=0×25+1×815+2×115=23E(XY)=0×(15+25+115+15)+1×1×215+1×2×0=215cov(X,Y)=21513×23=445
    cov(X,Y)E(X)E(Y)E(XY)cov(X,Y)=E(XY)E(X)E(Y)=0×32+1×31=31=0×52+1×158+2×151=32=0×(51+52+151+51)+1×1×152+1×2×0=152=15231×32=454

    相关系数

    定义:随机变量 X X X Y Y Y,如果 D ( X ) D ( Y ) ≠ 0 D(X)D(Y)\ne 0 D(X)D(Y)=0,则称 cov ( X , Y ) D ( X ) D ( Y )

    cov(X,Y)D(X)D(Y)" role="presentation" style="position: relative;">cov(X,Y)D(X)D(Y)
    D(X) D(Y) cov(X,Y) X X X Y Y Y的相关系数,记为 ρ X Y \rho_{XY} ρXY,即
    ρ X Y = cov ( X , Y ) D ( X ) D ( Y ) \rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} ρXY=D(X) D(Y) cov(X,Y)
    如果 D ( X ) D ( Y ) = 0 D(X)D(Y)=0 D(X)D(Y)=0,则 ρ X Y = 0 \rho_{XY}=0 ρXY=0
    如果随机变量 X X X Y Y Y的相关系数 ρ X Y = 0 \rho_{XY}=0 ρXY=0,则称 X X X Y Y Y不相关

    性质

    • ∣ ρ X Y ∣ ≤ 1 | \rho_{XY}| \leq 1 ρXY1
    • ∣ ρ X Y ∣ = 1 | \rho_{XY}|=1 ρXY=1的充分必要条件是存在常数 a a a b b b,其中 a ≠ 0 a \ne 0 a=0,使得
      P { Y = a X + b } = 1 P \left\{Y=aX+b\right\}=1 P{Y=aX+b}=1

    个人理解,相关系数的意义,相关系数可写作
    ρ = E ( X − E X ) ( Y − E ( Y ) ) D X D Y = E ( X − E X ) D X ⋅ E ( Y − E Y ) D Y \rho=\frac{E(X-EX)(Y-E(Y))}{\sqrt{DX}\sqrt{DY}}=\frac{E(X-EX)}{\sqrt{DX}}\cdot \frac{E(Y-EY)}{\sqrt{DY}} ρ=DX DY E(XEX)(YE(Y))=DX E(XEX)DY E(YEY)
    即两个变量标准化后的协方差。两变量的协方差如果很大,无法直接得到其是由于 E ( X ) E(X) E(X) E ( Y ) E(Y) E(Y)大导致,还是二者差异大导致,因此进行标准化

    例3:随机试验 E E E有三种两两不相容的结果 A 1 , A 2 , A 3 A_{1},A_{2},A_{3} A1,A2,A3,且三种结果发生的概率均为 1 3 \frac{1}{3} 31,将试验 E E E独立重复做 2 2 2次, X X X表示 2 2 2次试验中结果 A 1 A_{1} A1发生的次数, Y Y Y表示 2 2 2次试验中结果 A 2 A_{2} A2发生的次数,则 X X X Y Y Y的相关系数为()

    Z Z Z表示 2 2 2次试验中结果 A 3 A_{3} A3发生的次数,试验是独立重复的,把 A 3 A_{3} A3发生看成是试验成功,且 P ( A 3 ) = 1 3 P(A_{3})=\frac{1}{3} P(A3)=31,所以,随机变量 Z Z Z必服从二项分布 B ( 2 , 1 3 ) B(2, \frac{1}{3}) B(2,31),同理, X X X Y Y Y也都服从 B ( 2 , 1 3 ) B(2, \frac{1}{3}) B(2,31),因此 D X = D Y DX=DY DX=DY
    显然有
    X + Y + Z = 2 ⇒ Y = 2 − X − Z X+Y+Z=2 \Rightarrow Y=2-X-Z X+Y+Z=2Y=2XZ
    因此
    cov ( X , Y ) = cov ( X , 2 − X − Z ) = cov ( X , 2 ) − cov ( X , X ) − cov ( X , Z ) = 0 − D X − cov ( X , Z ) 由对称性cov ( X , Y ) = cov ( X , Z ) = − D X − cov ( X , Y )

    cov(X,Y)=cov(X,2XZ)=cov(X,2)cov(X,X)cov(X,Z)=0DXcov(X,Z)cov(X,Y)=cov(X,Z)=DXcov(X,Y)" role="presentation">cov(X,Y)=cov(X,2XZ)=cov(X,2)cov(X,X)cov(X,Z)=0DXcov(X,Z)cov(X,Y)=cov(X,Z)=DXcov(X,Y)
    cov(X,Y)=cov(X,2XZ)=cov(X,2)cov(X,X)cov(X,Z)=0DXcov(X,Z)由对称性cov(X,Y)=cov(X,Z)=DXcov(X,Y)

    cov ( X , Y ) = − D X 2 \text{cov}(X,Y)=- \frac{DX}{2} cov(X,Y)=2DX
    X X X Y Y Y的相关系数
    ρ X Y = cov ( X , Y ) D X D Y = − D X 2 D X = − 1 2 \rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{DX}\sqrt{DY}}=\frac{-\frac{DX}{2}}{DX}=- \frac{1}{2} ρXY=DX DY cov(X,Y)=DX2DX=21

    独立与不相关

    1. 如果随机变量 X X X Y Y Y相互独立,则 X X X Y Y Y必不相关;反之, X X X Y Y Y不相关时, X X X Y Y Y不一定相互独立
    2. 对二维正态随机变量 ( X , Y ) (X,Y) (X,Y) X X X Y Y Y相互独立的充分必要条件是 ρ = 0 \rho=0 ρ=0
    3. 对二维正态随机变量 ( X , Y ) (X,Y) (X,Y) X X X Y Y Y相互独立与 X X X Y Y Y不相关是等价的

    例4:设随机变量 X X X Y Y Y的概率分布分别为

    X X X 0 0 0 1 1 1
    P P P 1 3 \frac{1}{3} 31 2 3 \frac{2}{3} 32
    Y Y Y − 1 -1 1 0 0 0 1 1 1
    P P P 1 3 \frac{1}{3} 31 1 3 \frac{1}{3} 31 1 3 \frac{1}{3} 31

    P { X 2 = Y 2 } = 1 P \left\{X^{2}=Y^{2}\right\}=1 P{X2=Y2}=1

    • 求二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率分布

    P { X 2 = Y 2 } = 1 P \left\{X^{2}=Y^{2}\right\}=1 P{X2=Y2}=1,得 P { X 2 ≠ Y 2 } = 0 P \left\{X^{2}\ne Y^{2}\right\}=0 P{X2=Y2}=0,因此有

    X X X\ P P P − 1 -1 1 0 0 0 1 1 1 P i ⋅ P_{i \cdot } Pi
    0 0 0 0 0 0 0 0 0 1 3 \frac{1}{3} 31
    1 1 1 0 0 0 2 3 \frac{2}{3} 32
    P ⋅ j P_{\cdot j} Pj 1 3 \frac{1}{3} 31 1 3 \frac{1}{3} 31 1 3 \frac{1}{3} 31

    可得

    X X X\ P P P − 1 -1 1 0 0 0 1 1 1 P i ⋅ P_{i \cdot } Pi
    0 0 0 0 0 0 1 3 \frac{1}{3} 31 0 0 0 1 3 \frac{1}{3} 31
    1 1 1 1 3 \frac{1}{3} 31 0 0 0 1 3 \frac{1}{3} 31 2 3 \frac{2}{3} 32
    P ⋅ j P_{\cdot j} Pj 1 3 \frac{1}{3} 31 1 3 \frac{1}{3} 31 1 3 \frac{1}{3} 31
    • X X X Y Y Y是否相互独立,是否不相关

    显然存在 p i j ≠ p i ⋅ p ⋅ j p_{ij}\ne p_{i \cdot }p_{\cdot j} pij=pipj,因此 X X X Y Y Y不独立
    又有
    ρ X Y = cov ( X , Y ) D X D Y = E X Y − E X ⋅ E Y D X D Y = 0 − 2 3 × 0 D X D Y = 0

    ρXY=cov(X,Y)DXDY=EXYEXEYDXDY=023×0DXDY=0" role="presentation" style="position: relative;">ρXY=cov(X,Y)DXDY=EXYEXEYDXDY=023×0DXDY=0
    ρXY=DX DY cov(X,Y)=DX DY EXYEXEY=DX DY 032×0=0
    因此 X X X Y Y Y不相关,不独立

    例5:已知随机变量 ( X , Y ) (X,Y) (X,Y)服从二维正态分布 N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; 0 ) N(\mu_{1},\mu_{2};\sigma_{1}^{2},\sigma_{2}^{2};0) N(μ1,μ2;σ12,σ22;0),记 Z 1 = X + Y Z_{1}=X+Y Z1=X+Y Z 2 = X − Y Z_{2}=X-Y Z2=XY

    • ( Z 1 , Z 2 ) (Z_{1},Z_{2}) (Z1,Z2)的分布

    由于
    ∣ 1 1 1 − 1 ∣ ≠ 0

    |1111|" role="presentation" style="position: relative;">|1111|
    \ne 0 1111 =0
    因此 ( Z 1 , Z 2 ) = ( X + Y , X − Y ) (Z_{1},Z_{2})=(X+Y,X-Y) (Z1,Z2)=(X+Y,XY)服从二维正态
    D ( Z 1 ) = D ( X + Y ) = D X + D Y = σ 1 2 + σ 2 2 D ( Z 2 ) = D ( X − Y ) = D X + D Y = σ 1 2 + σ 2 2 cov ( Z 1 , Z 2 ) = cov ( X + Y , X − Y ) = cov ( X , X ) − cov ( X , Y ) + cov ( Y , X ) − cov ( Y , Y ) = σ 1 2 − σ 2 2 ρ Z 1 , Z 2 = cov ( Z 1 , Z 2 ) D Z 1 D Z 2 = σ 1 2 − σ 2 2 σ 1 2 + σ 2 2
    D(Z1)=D(X+Y)=DX+DY=σ12+σ22D(Z2)=D(XY)=DX+DY=σ12+σ22cov(Z1,Z2)=cov(X+Y,XY)=cov(X,X)cov(X,Y)+cov(Y,X)cov(Y,Y)=σ12σ22ρZ1,Z2=cov(Z1,Z2)DZ1DZ2=σ12σ22σ12+σ22" role="presentation" style="position: relative;">D(Z1)=D(X+Y)=DX+DY=σ12+σ22D(Z2)=D(XY)=DX+DY=σ12+σ22cov(Z1,Z2)=cov(X+Y,XY)=cov(X,X)cov(X,Y)+cov(Y,X)cov(Y,Y)=σ12σ22ρZ1,Z2=cov(Z1,Z2)DZ1DZ2=σ12σ22σ12+σ22
    D(Z1)D(Z2)cov(Z1,Z2)ρZ1,Z2=D(X+Y)=DX+DY=σ12+σ22=D(XY)=DX+DY=σ12+σ22=cov(X+Y,XY)=cov(X,X)cov(X,Y)+cov(Y,X)cov(Y,Y)=σ12σ22=DZ1 DZ2 cov(Z1,Z2)=σ12+σ22σ12σ22

    因此 ( Z 1 , Z 2 ) ∼ N ( μ 1 + μ 2 , μ 1 − μ 2 ; σ 1 2 + σ 2 2 , σ 1 2 − σ 2 2 ; σ 1 2 − σ 2 2 σ 1 2 + σ 2 2 )
    (Z1,Z2)N(μ1+μ2,μ1μ2;σ12+σ22,σ12σ22;σ12σ22σ12+σ22)" role="presentation" style="position: relative;">(Z1,Z2)N(μ1+μ2,μ1μ2;σ12+σ22,σ12σ22;σ12σ22σ12+σ22)
    (Z1,Z2)N(μ1+μ2,μ1μ2;σ12+σ22,σ12σ22;σ12+σ22σ12σ22)

    • Z 1 Z_{1} Z1 Z 2 Z_{2} Z2是否相互独立

    σ 1 = σ 2 \sigma_{1}=\sigma_{2} σ1=σ2时, ρ Z 1 Z 2 = 0 ⇒

    ρZ1Z2=0" role="presentation" style="position: relative;">ρZ1Z2=0
    ρZ1Z2=0 Z 1 , Z 2 Z_{1},Z_{2} Z1,Z2不相关,相互独立
    σ 1 ≠ σ 2 \sigma_{1}\ne \sigma_{2} σ1=σ2时, ρ Z 1 Z 2 ≠ 0 ⇒
    ρZ1Z20" role="presentation" style="position: relative;">ρZ1Z20
    ρZ1Z2=0
    Z 1 , Z 2 Z_{1},Z_{2} Z1,Z2不相互独立

    ( X , Y ) (X,Y) (X,Y)是正态时,不相关与独立等价
    ( X , Y ) (X,Y) (X,Y)正态时, X X X Y Y Y必正态,反之不一定
    X X X Y Y Y均正态且相互独立,则 ( X , Y ) (X,Y) (X,Y)必正态
    ( X , Y ) (X,Y) (X,Y)正态的充要条件为 ∣ a b c d ∣ ≠ 0

    |abcd|" role="presentation" style="position: relative;">|abcd|
    \ne 0 acbd =0时, ( a X + b Y , c X + d Y ) (aX+bY,cX+dY) (aX+bY,cX+dY)为正态

    例6:设随机变量 ( X , Y ) (X,Y) (X,Y)服从二维正态分布 N ( 0 , 0 ; 1 , 4 ; − 1 2 )

    N(0,0;1,4;12)" role="presentation" style="position: relative;">N(0,0;1,4;12)
    N(0,0;1,4;21),证明 3 3 ( X + Y )
    33(X+Y)" role="presentation" style="position: relative;">33(X+Y)
    33 (X+Y)
    是标准正态分布,且与 X X X独立的是

    显然 X ∼ N ( 0 , 1 ) , Y ∼ ( 0 , 4 ) X \sim N(0,1),Y \sim (0,4) XN(0,1),Y(0,4)
    cov ( X , Y ) = ρ D X D Y = − 1 D ( X + Y ) = D X + D Y + 2 cov ( X , Y ) = 3

    cov(X,Y)=ρDXDY=1D(X+Y)=DX+DY+2cov(X,Y)=3" role="presentation" style="position: relative;">cov(X,Y)=ρDXDY=1D(X+Y)=DX+DY+2cov(X,Y)=3
    cov(X,Y)D(X+Y)=ρDX DY =1=DX+DY+2cov(X,Y)=3

    注意这里 D ( X + Y ) ≠ D X + D Y D(X+Y)\ne DX+DY D(X+Y)=DX+DY,由于没有 X , Y X,Y X,Y相互独立的条件

    E [ 3 3 ( X + Y ) ] = 3 3 ( E X + E Y ) = 0 D [ 3 3 ( X + Y ) ] = 3 3 2 D ( X + Y ) = 1 cov ( 3 3 ( X + Y ) , X ) = 3 3 [ cov ( X , X ) + cov ( Y , X ) ] = 0 ρ 3 3 ( X + Y ) , X = 0

    E[33(X+Y)]=33(EX+EY)=0D[33(X+Y)]=332D(X+Y)=1cov(33(X+Y),X)=33[cov(X,X)+cov(Y,X)]=0ρ33(X+Y),X=0" role="presentation" style="position: relative;">E[33(X+Y)]=33(EX+EY)=0D[33(X+Y)]=332D(X+Y)=1cov(33(X+Y),X)=33[cov(X,X)+cov(Y,X)]=0ρ33(X+Y),X=0
    E[33 (X+Y)]D[33 (X+Y)]cov(33 (X+Y),X)ρ33 (X+Y),X=33 (EX+EY)=0=323D(X+Y)=1=33 [cov(X,X)+cov(Y,X)]=0=0
    由于
    ∣ 3 3 3 3 1 0 ∣ ≠ 0
    |333310|" role="presentation" style="position: relative;">|333310|
    \ne 0
    33 133 0 =0

    因此 ( 3 3 ( X + Y ) , X )
    (33(X+Y),X)" role="presentation" style="position: relative;">(33(X+Y),X)
    (33 (X+Y),X)
    也服从二维正态分布,其中 ρ 3 3 ( X + Y ) , X = 0 \rho_{\frac{\sqrt{3}}{3}(X+Y),X}=0 ρ33 (X+Y),X=0,因此二者独立

    CSDN话题挑战赛第2期
    参赛话题:学习笔记

  • 相关阅读:
    MySQL基于GTID建立半同步复制
    蓝桥杯倒计时47天!DFS基础——图的遍历
    SpringBoot电商项目实战Day6 堆排序
    新手向:如何考虑将数据库技术和大数据框架结合使用?
    C/C++语言100题练习计划 79——整数奇偶数排序(sort函数实现)
    今日好料推荐(ARM嵌入式)
    Linux多线程(读者写者问题与自旋锁)
    Qt教程 — 3.4 深入了解Qt 控件:Input Widgets部件(3)
    RK3399平台开发系列讲解(内核调试篇)IO 数据工具:iostat和iotop
    红色罗丹明标记修饰牛血清白蛋白;RBITC-Bovine Serum Albumin(BSA)
  • 原文地址:https://blog.csdn.net/liu20020918zz/article/details/126924917