• 机器学习基础:参数估计与假设检验



    机器学习必备基础知识,力求以最简洁的语言,描述最完整的内容。
    很多知识没有深入剖析,也没必要深入剖析。大致了解知识框架之后,即可开始学习机器学习,有不懂的再回过头仔细研究,驱动式学习才是最高效的学习。

    在这里插入图片描述

    参数估计

    点估计

    • 参数估计

      • X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是总体 X X X的一个样本,其分布函数为 F ( x ; θ ) , θ ∈ Θ F(x;\theta),\theta\in\Theta F(x;θ),θΘ,其中 θ \theta θ为未知参数, Θ \Theta Θ为参数空间,若统计量 g ( X 1 , . . . , X n ) g(X_1,...,X_n) g(X1,...,Xn)可作为 θ \theta θ的一个估计,则称其为 θ \theta θ的一个估计量,记为 θ ^ \hat\theta θ^,即 θ ^ = g ( X 1 , . . . , X n ) \hat\theta=g(X_1,...,X_n) θ^=g(X1,...,Xn)
      • 注:分布函数 F ( x ; θ ) F(x;\theta) F(x;θ)也可用分布律(离散型)或密度函数(连续性)代替
    点估计
    • x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn是样本的一个观测值,则称为 θ \theta θ的估计值
    • 由于 g ( x 1 , x 2 , . . . , x n ) g(x_1,x_2,...,x_n) g(x1,x2,...,xn)是实数域上的一个点,现用它来估计 θ \theta θ,故称这种估计为点估计
    • 经典方法
      • 矩估计法
      • 极大似然估计法
    矩估计
    • 用样本矩作为总体同阶矩的估计,即
      E ( X k ^ ) = 1 n ∑ i = 1 n X i k E(\hat{X^k})=\frac1n\sum_{i=1}^nX_i^k E(Xk^)=n1i=1nXik
      也就是说,先根据具体分布条件,将 E ( X k ) E(X^k) E(Xk)求出来,是一个关于未知参数 θ \theta θ的式子,然后将上式代入,解出 θ ^ \hat\theta θ^
    极大似然估计
    • 思想:一件事情发生或不发生,如果试验一次就发生了,给我们的感觉就是发生的概率比不发生要大。

      • 一般来说,事件 A A A发生的概率与参数 θ ∈ Θ \theta\in\Theta θΘ有关, θ \theta θ取值不同, P ( A ) P(A) P(A)也不同,所以应该记事件 A A A发生概率为 P ( A ∣ θ ) P(A|\theta) P(Aθ),若 A A A发生了,则认为此时的 θ \theta θ值应是在 Θ \Theta Θ中使得 P ( A ∣ θ ) P(A|\theta) P(Aθ)达到最大的那一个
    • 对离散型随机变量 P { X = a k ∣ θ } = P θ ( a k ) , k = 1 , 2 , . . . P\{X=a_k|\theta\}=P_{\theta}(a_k),k=1,2,... P{X=akθ}=Pθ(ak),k=1,2,...,现有样本观察值 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn,如何用极大似然估计来估计 θ \theta θ

      • A = { X 1 = x 1 , . . . , X n = x n } A=\{X_1=x_1,...,X_n=x_n\} A={X1=x1,...,Xn=xn},则
        P ( A ∣ θ ) = P θ { X 1 = x 1 , . . . , X n = x n } = ∏ i = 1 n P θ ( x i ) P(A|\theta)=P_{\theta}\{X_1=x_1,...,X_n=x_n\}=\prod_{i=1}^nP_{\theta}(x_i) P(Aθ)=Pθ{X1=x1,...,Xn=xn}=i=1nPθ(xi)
        根据极大似然思想, θ \theta θ的值应使得样本联合分布律 ∏ i = 1 n P θ ( x i ) \prod_{i=1}^nP_{\theta}(x_i) i=1nPθ(xi)达到最大
    • 连续型同理

    • 似然函数

      • X 1 , . . . , X n X_1,...,X_n X1,...,Xn独立同分布于密度函数 f ( x ; θ ) f(x;\theta) f(x;θ),则称
        L ( θ ) = L ( x 1 , . . . , x n ; θ ) = ∏ i = 1 n f ( x i ; θ ) L(\theta)=L(x_1,...,x_n;\theta)=\prod_{i=1}^nf(x_i;\theta) L(θ)=L(x1,...,xn;θ)=i=1nf(xi;θ)
        为总体 X X X似然函数

      • 若有 θ ^ ∈ Θ \hat\theta\in\Theta θ^Θ使得 L ( θ ^ ) = max ⁡ θ ∈ Θ L ( θ ) L(\hat\theta)=\max_{\theta\in\Theta}L(\theta) L(θ^)=maxθΘL(θ),则称 θ ^ \hat\theta θ^ θ \theta θ的极大似然估计,记为 θ ^ M L E \hat\theta_{MLE} θ^MLE

    • 求极大似然估计的步骤

      • 做似然函数
        L ( θ ) = L ( x 1 , . . . , x n ; θ ) = ∏ i = 1 n f ( x i ; θ ) L(\theta)=L(x_1,...,x_n;\theta)=\prod_{i=1}^nf(x_i;\theta) L(θ)=L(x1,...,xn;θ)=i=1nf(xi;θ)

      • 做对数似然函数
        ln ⁡ L ( θ ) = ln ⁡ L ( x 1 , . . . , x n ; θ ) = ∑ i = 1 n ln ⁡ f ( x i ; θ ) ln ⁡ L ( θ ) = ln ⁡ L ( x 1 , . . . , x n ; θ ) = ∑ i = 1 n ln ⁡ f ( x i ; θ ) \ln L(\theta)=\ln L(x_1,...,x_n;\theta)=\sum_{i=1}^n\ln f(x_i;\theta)\ln L(\theta)=\ln L(x_1,...,x_n;\theta)=\sum_{i=1}^n\ln f(x_i;\theta) lnL(θ)=lnL(x1,...,xn;θ)=i=1nlnf(xi;θ)lnL(θ)=lnL(x1,...,xn;θ)=i=1nlnf(xi;θ)

      • 列方程
        d [ ln ⁡ L ( θ ) ] d θ = 0 \frac{d[\ln L(\theta)]}{d\theta}=0 dθd[lnL(θ)]=0
        若有解,则解就是 θ ^ M L E ( X 1 , . . . , X n ) \hat\theta_{MLE}(X_1,...,X_n) θ^MLE(X1,...,Xn)

    • 当由似然方程解不出 θ \theta θ的似然估计时,可由定义通过分析直接推求(见 p p t ppt ppt

    估计量的评选标准

    无偏性

    • θ ^ = θ ^ ( X 1 , . . . , X n ) \hat\theta=\hat\theta(X_1,...,X_n) θ^=θ^(X1,...,Xn) θ \theta θ的估计量,若 E θ ^ = θ E\hat\theta=\theta Eθ^=θ,则称 θ ^ \hat\theta θ^ θ \theta θ的无偏估计量

      实际意义就是说,用估计量 θ ^ \hat\theta θ^来对未知参数 θ \theta θ进行估计,有时会高于 θ \theta θ,有时会低于 θ \theta θ,但平均下来还是相等的,也就是没有系统误差

    一些性质

    • X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是来自总体的一个样本,那么 k k k阶样本原点矩 A k A_k Ak是总体样本原点矩 μ k \mu_k μk (如果存在的话)的无偏估计,即
      E ( A k ) = E [ 1 n ∑ i = 1 n X i k ] E(A_k)=E[\frac1n\sum_{i=1}^nX_i^k] E(Ak)=E[n1i=1nXik]

    • 总体 X X X的方差 σ 2 \sigma^2 σ2存在且有限, X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是来自总体的一个样本,则样本方差 S 2 S^2 S2是总体方差 σ 2 \sigma^2 σ2无偏估计
      S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 ∑ i = 1 n X i 2 − n n − 1 ( X ‾ ) 2 E ( S 2 ) = 1 n − 1 ∑ i = 1 n E ( X i 2 ) − n n − 1 E ( X ‾ ) 2 = 1 n − 1 ∑ i = 1 n ( σ 2 + μ 2 ) − n n − 1 ( σ 2 n + μ 2 ) = σ 2 S^2=\frac1{n-1}\sum_{i=1}^n(X_i-\overline X)^2=\frac1{n-1}\sum_{i=1}^nX_i^2-\frac n{n-1}(\overline X)^2\\ E(S^2)=\frac1{n-1}\sum_{i=1}^nE(X_i^2)-\frac n{n-1}E(\overline X)^2\\ =\frac1{n-1}\sum_{i=1}^n(\sigma^2+\mu^2)-\frac n{n-1}(\frac{\sigma^2}{n}+\mu^2)=\sigma^2 S2=n11i=1n(XiX)2=n11i=1nXi2n1n(X)2E(S2)=n11i=1nE(Xi2)n1nE(X)2=n11i=1n(σ2+μ2)n1n(nσ2+μ2)=σ2
      同时可见,样本中心二阶矩 S ∗ 2 = 1 n ∑ i = 1 n ( X i − X ‾ ) 2 S^{*2}=\frac1n\sum_{i=1}^n(X_i-\overline X)^2 S2=n1i=1n(XiX)2不是方差 σ 2 \sigma^2 σ2的无偏估计,

      但有 E ( S ∗ 2 ) = n − 1 n σ 2 → σ 2 E(S^{*2})=\frac{n-1}{n}\sigma^2\rightarrow\sigma^2 E(S2)=nn1σ2σ2,我们称 S ∗ 2 S^{*2} S2 σ 2 \sigma^2 σ2渐进无偏估计

    • 有效性

      • θ ^ i , i = 1 , 2 \hat\theta_i,i=1,2 θ^i,i=1,2分别是参数 θ \theta θ的两个无偏估计即 E ( θ ^ i ) = θ E(\hat\theta_i)=\theta E(θ^i)=θ,若 D θ ^ 1 < D θ ^ 2 D\hat\theta_1Dθ^1<Dθ^2,则称 θ ^ 1 \hat\theta_1 θ^1 θ ^ 2 \hat\theta_2 θ^2有效,也就是比较 E ( θ ^ i − θ ) 2 E(\hat\theta_i-\theta)^2 E(θ^iθ)2(称为均方误差,记为 M ( θ ^ , θ ) = E ( θ ^ − θ ) 2 M(\hat\theta,\theta)=E(\hat\theta-\theta)^2 M(θ^,θ)=E(θ^θ)2
    • 一致性

      • θ ^ n = θ ^ ( X 1 , X 2 , . . . , X n ) \hat\theta_n=\hat\theta(X_1,X_2,...,X_n) θ^n=θ^(X1,X2,...,Xn) θ \theta θ的估计量,若 θ n ^ − > [ p ] θ {{\hat{\theta_n}}->[p]\theta} θn^>[p]θ,则称 θ ^ n \hat\theta_n θ^n θ \theta θ的一致估计量

    区间估计

    前面是用一个点来估计未知参数,那么现在尝试构造一个区间 ( θ ^ 1 , θ ^ 2 ) (\hat\theta_1,\hat\theta_2) (θ^1,θ^2)来估计参数 θ \theta θ的范围

    • 定义

      • θ \theta θ是总体 X X X的未知参数, X 1 , . . . , X n X_1,...,X_n X1,...,Xn是来自总体 X X X的样本,若对给定值 α ∈ ( 0 , 1 ) \alpha\in(0,1) α(0,1),存在两个统计量 θ ^ 1 ( X 1 , . . . , X n ) , θ ^ 2 ( X 1 , . . . , X n ) \hat\theta_1(X_1,...,X_n),\hat\theta_2(X_1,...,X_n) θ^1(X1,...,Xn),θ^2(X1,...,Xn),使得
        P ( θ ^ 1 < θ < θ ^ 2 ) = 1 − α P(\hat\theta_1<\theta<\hat\theta_2)=1-\alpha P(θ^1<θ<θ^2)=1α
        则称区间 ( θ ^ 1 , θ ^ 2 ) (\hat\theta_1,\hat\theta_2) (θ^1,θ^2),是 θ \theta θ置信度 1 − α 1-\alpha 1α置信区间 θ ^ 1 , θ ^ 2 \hat\theta_1,\hat\theta_2 θ^1,θ^2为置信下限和置信上限

      • 单侧置信区间

        • θ \theta θ是总体 X X X的未知参数, X 1 , . . . , X n X_1,...,X_n X1,...,Xn是来自总体 X X X的样本,若对给定值 α ∈ ( 0 , 1 ) \alpha\in(0,1) α(0,1),存在统计量 θ ^ 1 ( X 1 , . . . , X n ) \hat\theta_1(X_1,...,X_n) θ^1(X1,...,Xn),使得
          p ( θ ^ 1 < θ ) = 1 − α p(\hat\theta_1<\theta)=1-\alpha p(θ^1<θ)=1α
          则称 ( θ ^ 1 , + ∞ ) (\hat\theta_1,+\infin) (θ^1,+) θ \theta θ的置信度为 1 − α 1-\alpha 1α的单侧置信区间, θ ^ 1 \hat\theta_1 θ^1称为置信度为 1 − α 1-\alpha 1α单侧置信下限, θ ^ 2 \hat\theta_2 θ^2同理
    • 正态总体参数的区间估计

      • X 1 , . . . , X n X_1,...,X_n X1,...,Xn独立同分布 ∼ N ( μ , σ 2 ) \sim N(\mu,\sigma^2) N(μ,σ2),给定 α \alpha α,由观测值 x 1 , . . . , x n x_1,...,x_n x1,...,xn,求出样本均值 μ \mu μ 1 − α 1-\alpha 1α置信区间

        • (1)当 σ 2 \sigma^2 σ2已知时

          由于 μ \mu μ的点估计量为 X ‾ \overline{X} X,且 X ‾ ~ N ( μ , δ 2 n ) \overline{X}~N(\mu,\frac{\delta^2}{n}) XN(μ,nδ2),构造
          U = d e f X ‾ − μ σ / n ~ N ( 0 , 1 ) U\xlongequal{def}\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}~N(0,1) Udef σ/n XμN(0,1)
          则对于给定的置信度 1 − α 1-\alpha 1α,由分位点的概念知,存在一个标准正态分布上的 α 2 \frac{\alpha}{2} 2α分位点 u α 2 u_{\frac{\alpha}{2}} u2α,使得
          P { ∣ X ‾ − μ σ / n ∣ < u α 2 } = 1 − α P\{|\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}|P{σ/n Xμ<u2α}=1α
          因为加了绝对值所以是 u α 2 u_{\frac{\alpha}{2}} u2α,解得
          P { X ‾ − u α 2 σ n < μ < X ‾ + u α 2 σ n } = 1 − α P\{\overline{X}-u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}<\mu<\overline{X}+u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\}=1-\alpha P{Xu2αn σ<μ<X+u2αn σ}=1α
          所以 μ \mu μ的置信度为 1 − α 1-\alpha 1α的置信区间为
          ( X ‾ − u α 2 σ n , X ‾ + u α 2 σ n ) (\overline{X}-u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}},\overline{X}+u_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}) (Xu2αn σX+u2αn σ)
          在这里插入图片描述

          当然 μ \mu μ的置信区间并不唯一,从图上可以看出,
          ∀ θ , ( X ‾ − u θ α σ n , X ‾ + u ( 1 − θ ) α σ n ) \forall\theta,(\overline{X}-u_{\theta{\alpha}}\frac{\sigma}{\sqrt{n}},\overline{X}+u_{(1-\theta){\alpha}}\frac{\sigma}{\sqrt{n}}) θ,(Xuθαn σX+u(1θ)αn σ)
          都是 μ \mu μ 1 − α 1-\alpha 1α置信区间,只是 θ = 1 2 \theta=\frac12 θ=21时区间长度最短

        • 由上述过程可以总结出,求正态总体参数置信区间的解题步骤:

          • 构造样本的函数,要求仅含待估参数且分布已知——枢轴量
          • 令枢轴量落在分位点确定的区间中的概率为给定的置信度( 1 − α 1-\alpha 1α)。要求区间按几何对称或概率对称
          • 解不等式得随机的置信区间
          • 由观测值及 α \alpha α值查表计算得所求置信区间
        • (2)当 σ 2 \sigma^2 σ2未知时,要求总体均值 μ \mu μ的区间估计


          T = X ‾ − μ S / n ~ t ( n − 1 ) T=\frac{\overline{X}-\mu}{S/\sqrt{n}}~t(n-1) T=S/n Xμt(n1)
          S S S为样本标准差)从而有
          P { ∣ X ‾ − μ S / n ∣ < t α 2 ( n − 1 ) } = 1 − α P\{|\frac{\overline{X}-\mu}{S/\sqrt{n}}|P{S/n Xμ<t2α(n1)}=1α
          解得
          P { X ‾ − t α 2 ( n − 1 ) S n ≤ μ ≤ X ‾ + t α 2 ( n − 1 ) S n } = 1 − α P\{\overline{X}-t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}\leq\mu\leq \overline{X}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}\}=1-\alpha P{Xt2α(n1)n SμX+t2α(n1)n S}=1α
          所以 μ \mu μ的置信度为 1 − α 1-\alpha 1α的置信区间为
          ( X ‾ − t α 2 ( n − 1 ) S n , X ‾ + t α 2 ( n − 1 ) S n ) (\overline{X}-t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}},\overline{X}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}) Xt2α(n1)n SX+t2α(n1)n S

      • X 1 , . . . , X n X_1,...,X_n X1,...,Xn独立同分布 ∼ N ( μ , σ 2 ) \sim N(\mu,\sigma^2) N(μ,σ2),给定 α \alpha α,由观测值 x 1 , . . . , x n x_1,...,x_n x1,...,xn,求出样本方差 σ 2 \sigma^2 σ2 1 − α 1-\alpha 1α置信区间

        • 假定 μ \mu μ未知,引进
          χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1) χ2=σ2(n1)S2χ2(n1)
          对于给定的置信度,可以有这样的构造
          P { χ 2 < χ 1 − α 2 2 ( n − 1 ) } = α 2 P { χ 2 > χ α 2 2 ( n − 1 ) } = α 2 P\{\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\}=\frac{\alpha}{2}\\ P\{\chi^2>\chi^2_{\frac{\alpha}{2}}(n-1)\}=\frac{\alpha}{2} P{χ2<χ12α2(n1)}=2αP{χ2>χ2α2(n1)}=2α
          于是有
          P { χ 1 − α 2 2 ( n − 1 ) < ( n − 1 ) S 2 σ 2 < χ α 2 2 ( n − 1 ) } = 1 − α P\{\chi^2_{1-\frac{\alpha}{2}}(n-1)<\frac{(n-1)S^{^2}}{\sigma^2}<\chi^2_{\frac{\alpha}{2}}(n-1)\}=1-\alpha P{χ12α2(n1)<σ2(n1)S2<χ2α2(n1)}=1α
          从而
          P { ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) < σ 2 < ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) } = 1 − α P\{\frac{(n-1)S^{^2}}{\chi^2_{\frac{\alpha}{2}}(n-1)}<\sigma^2<\frac{(n-1)S^{^2}}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\}=1-\alpha P{χ2α2(n1)(n1)S2<σ2<χ12α2(n1)(n1)S2}=1α
          所以 σ 2 \sigma^2 σ2 1 − α 1-\alpha 1α置信区间为
          ( ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) ) (\frac{(n-1)S^{^2}}{\chi^2_{\frac{\alpha}{2}}(n-1)},\frac{(n-1)S^{^2}}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}) (χ2α2(n1)(n1)S2,χ12α2(n1)(n1)S2)
          σ \sigma σ 1 − α 1-\alpha 1α置信区间为
          ( ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) ) (\sqrt{\frac{(n-1)S^{^2}}{\chi^2_{\frac{\alpha}{2}}(n-1)}},\sqrt{\frac{(n-1)S^{^2}}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}}) (χ2α2(n1)(n1)S2 ,χ12α2(n1)(n1)S2 )
      • 上面是对单个正态总体的均值/方差的区间估计,下面是求两个正态总体均值差的置信区间:

        X 1 , . . . , X n X_1,...,X_n X1,...,Xn独立同分布 ∼ N ( μ 1 , σ 1 2 ) \sim N(\mu_1,\sigma_1^2) N(μ1,σ12) Y 1 , . . . , Y n Y_1,...,Y_n Y1,...,Yn独立同分布 ∼ N ( μ 2 , σ 2 2 ) \sim N(\mu_2,\sigma_2^2) N(μ2,σ22),两样本独立。给定置信度 1 − α 1-\alpha 1α,求 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2的置信区间

        • 假设 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2未知,引进
          T = X ‾ − Y ‾ − ( μ 1 − μ 2 ) S w 1 / n 1 + 1 / n 2 ∼ t ( n 1 − 1 + n 2 − 1 ) T=\frac{\overline X-\overline Y-(\mu_1-\mu_2)}{S_w\sqrt{1/n_1+1/n_2}}\sim t(n_1-1+n_2-1) T=Sw1/n1+1/n2 XY(μ1μ2)t(n11+n21)
          那么有
          P { ∣ T ∣ < t α 2 ( n 1 + n 2 − 2 ) } = 1 − α P\{|T|P{T<t2α(n1+n22)}=1α
          可解得 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2得置信区间
          ( X ‾ − Y ‾ − t α 2 ( n 1 + n 2 − 2 ) S w 1 / n 1 + 1 / n 2 ,    X ‾ − Y ‾ + t α 2 ( n 1 + n 2 − 2 ) S w 1 / n 1 + 1 / n 2 ) , 其中 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 (\overline X-\overline Y-t_{\frac\alpha2}(n_1+n_2-2)S_w\sqrt{1/n_1+1/n_2},\ \ \overline X-\overline Y+t_{\frac\alpha2}(n_1+n_2-2)S_w\sqrt{1/n_1+1/n_2}),其中\\ S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} (XYt2α(n1+n22)Sw1/n1+1/n2 ,  XY+t2α(n1+n22)Sw1/n1+1/n2 ),其中Sw2=n1+n22(n11)S12+(n21)S22

        • σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2已知时,相当于是求 Z i = X i − Y i ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) Z_i=X_i-Y_i\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) Zi=XiYiN(μ1μ2,n1σ12+n2σ22),类似单个正态总体 σ 2 \sigma^2 σ2已知时求 μ \mu μ的区间估计

      • σ 1 2 σ 2 2 \frac{\sigma_1^2}{\sigma_2^2} σ22σ12的置信区间

        • 假定 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知,引进
          F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-1) F=S22/σ22S12/σ12F(n11,n21)
          根据 F F F分布图像分位点可知
          P { F > F α 2 ( n 1 − 1 , n 2 − 1 ) } = α 2 , P { F < F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) } = α 2 P\{F>F_{\frac\alpha2}(n_1-1,n_2-1)\}=\frac\alpha2,\\ P\{FP{F>F2α(n11,n21)}=2α,P{F<F12α(n11,n21)}=2α
          所以有
          P { F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) < F < F α 2 ( n 1 − 1 , n 2 − 1 ) } = 1 − α P\{F_{1-\frac\alpha2}(n_1-1,n_2-1)P{F12α(n11,n21)<F<F2α(n11,n21)}=1α
          可解得 σ 1 2 σ 2 2 \frac{\sigma_1^2}{\sigma_2^2} σ22σ12的置信区间为
          ( S 1 2 / S 2 2 F α 2 ( n 1 − 1 , n 2 − 1 ) ,    S 1 2 / S 2 2 F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) ) (\frac{{S_1^2}/{S_2^2}}{F_{\frac\alpha2}(n_1-1,n_2-1)},\ \ \frac{{S_1^2}/{S_2^2}}{F_{1-\frac\alpha2}(n_1-1,n_2-1)}) (F2α(n11,n21)S12/S22,  F12α(n11,n21)S12/S22)

    假设检验

    假设检验的基本概念

    根据长期经验和资料分析,某厂生产的砖的“抗断强度” X X X服从正态分布 N ( μ , 1. 1 2 ) N(\mu,1.1^2) N(μ,1.12),从该厂生产的一批砖中随机抽取6块,测得抗断强度 ( k g / c m 2 ) (kg/cm^2) (kg/cm2)为:32.56, 29.66, 31.64, 30.00, 31.87, 31.03,请问可否认为这批砖的平均抗断强度为 μ 0 = 32.50 \mu_0=32.50 μ0=32.50?

    • 引出假设检验的基本概念:

      上面的问题就是要检验:
      H 0 : μ = μ 0 = 32.50 ,    H 1 : μ ≠ μ 0 {\rm H_0}:\mu=\mu_0=32.50,\ \ {\rm H_1}:\mu\neq\mu_0 H0:μ=μ0=32.50,  H1:μ=μ0
      其中 H 0 {\rm H_0} H0称为原假设零假设 H 1 {\rm H_1} H1称为备择假设对立假设

    • 以上述问题为例说明假设检验的具体过程

      • 首先考虑 μ \mu μ的估计,由辛钦大数定律:样本均值 X ‾ \overline X X依概率收敛到总体均值 μ \mu μ,并且估计理论: X ‾ \overline X X μ \mu μ的无偏估计

      • 那么,如果 H 0 \rm H_0 H0成立,那么样本均值 X ‾ \overline X X μ 0 \mu_0 μ0的差距应该不会太大,即 ∣ X ‾ − μ 0 ∣ |\overline X-\mu_0| Xμ0较小,也就是 X ‾ − μ 0 σ / n \frac{\overline X-\mu_0}{\sigma/\sqrt{n}} σ/n Xμ0较小;反之,当 H 1 \rm H_1 H1成立时, X ‾ − μ 0 σ / n \frac{\overline X-\mu_0}{\sigma/\sqrt{n}} σ/n Xμ0较大

        因此可以适当选取一个正数 k k k作为临界点,当 X ‾ − μ 0 σ / n ⩾ k \frac{\overline X-\mu_0}{\sigma/\sqrt{n}}\geqslant k σ/n Xμ0k时,拒接假设 H 0 \rm H_0 H0,反之,当 X ‾ − μ 0 σ / n < k \frac{\overline X-\mu_0}{\sigma/\sqrt{n}}σ/n Xμ0<k时,接收假设 H 0 \rm H_0 H0

      • 我们假设 H 0 \rm H_0 H0为真,构造统计量
        Z = X ‾ − μ 0 σ / n ∼ N ( 0 , 1 ) Z=\frac{\overline X-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/n Xμ0N(0,1)
        给定一个小概率 α \alpha α(称为显著性水平),在 H 0 \rm H_0 H0成立的前提下有
        P ( ∣ Z ∣ ⩾ k ) = P ( ∣ X ‾ − μ 0 σ / n ∣ ⩾ k ) = α P(|Z|\geqslant k)=P(|\frac{\overline X-\mu_0}{\sigma/\sqrt{n}}|\geqslant k)=\alpha P(Zk)=P(σ/n Xμ0k)=α
        由分位点的知识可以知道 k = u α 2 k=u_{\frac{\alpha}{2}} k=u2α

      • 由于 α \alpha α是一个小概率,所以 ∣ X ‾ − μ 0 σ / n ∣ ⩾ u α 2 |\frac{\overline X-\mu_0}{\sigma/\sqrt{n}}|\geqslant u_{\frac{\alpha}{2}} σ/n Xμ0u2α是小概率事件,在一次试验中几乎不可能发生,

        当样本观察值 x ‾ \overline x x满足 ∣ x ‾ − μ 0 σ / n ∣ ⩾ u α 2 |\frac{\overline x-\mu_0}{\sigma/\sqrt{n}}|\geqslant u_{\frac{\alpha}{2}} σ/n xμ0u2α时,小概率事件发生,故拒绝假设 H 0 \rm H_0 H0;反之,接受假设 H 0 \rm H_0 H0

    • 根据上面的过程可以总结出假设检验的基本步骤

      • 根据问题提出原假设 H 0 \rm H_0 H0和对立假设 H 1 \rm H_1 H1
      • 构造一个合适的统计量,并在 H 0 \rm H_0 H0成立的条件下推导出该统计量的分布
      • 给出小概率 α \alpha α,确定临界值和拒绝域
      • 由样本算出统计量的观察值,若落在拒绝域,则拒绝 H 0 \rm H_0 H0,反之接受 H 0 \rm H_0 H0
        • 其中例子中的 Z = X ‾ − μ 0 σ / n Z=\frac{\overline X-\mu_0}{\sigma/\sqrt{n}} Z=σ/n Xμ0称为检验统计量 W = { ∣ X ‾ − μ 0 σ / n ∣ ⩾ u α 2 } W=\{|\frac{\overline X-\mu_0}{\sigma/\sqrt{n}}|\geqslant u_{\frac{\alpha}{2}}\} W={σ/n Xμ0u2α}称为拒绝域 W = { ∣ X ‾ − μ 0 σ / n ∣ < u α 2 } W=\{|\frac{\overline X-\mu_0}{\sigma/\sqrt{n}}|W={σ/n Xμ0<u2α}称为接受域
        • 我们上面例子中的检验法使用了正态统计量及其符号 Z = X ‾ − μ 0 σ / n Z=\frac{\overline X-\mu_0}{\sigma/\sqrt{n}} Z=σ/n Xμ0,故称为 Z Z Z检验法
    • 假设检验的两类错误

      • 弃真错误(第一类错误):原假设 H 0 \rm H_0 H0正确,但由于统计量的值落在了拒绝域,所以拒绝了原假设

        • 显然第一类错误发生的概率就是上面提到的“小概率事件”,可以理解成 假设是对的,但是抽到的样本碰巧出了问题
          P ( 拒绝 H 0 ∣ H 0 为真 ) = P ( U ∈ W ∣ H 0 为真 ) = α P(拒绝\rm H_0|\rm H_0为真)=P(U\in W|\rm H_0为真)=\alpha P(拒绝H0H0为真)=P(UW∣H0为真)=α
          α \alpha α称为显著性水平
      • 存伪错误(第二类错误):原假设 H 0 \rm H_0 H0错误,但由于统计量的值落在了接受域,所以接受了原假设

        • 第二类错误一般记做 β \beta β
          P ( 接受 H 0 ∣ H 1 为真 ) = P ( U ∉ W ∣ H 1 为真 ) = β P(接受\rm H_0|\rm H_1为真)=P(U\notin W|\rm H_1为真)=\beta P(接受H0H1为真)=P(U/W∣H1为真)=β
    • 检验的类型

      • 双边检验:对立假设分居原假设的两边,即形如
        H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 \rm H_0:\mu=\mu_0,\\ \rm H_1:\mu\neq\mu_0 H0:μ=μ0,H1:μ=μ0

      • 左边检验
        H 0 : μ ⩾ μ 0 , H 1 : μ < μ 0 \rm H_0:\mu\geqslant\mu_0,\\ \rm H_1:\mu<\mu_0 H0:μμ0,H1:μ<μ0

      • 右边检验
        H 0 : μ ⩽ μ 0 , H 1 : μ > μ 0 \rm H_0:\mu\leqslant\mu_0,\\ \rm H_1:\mu>\mu_0 H0:μμ0,H1:μ>μ0

    正态总体参数的检验

    • 单个正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)均值 μ \mu μ的检验

      • σ 2 \sigma^2 σ2已知: Z Z Z检验(书上是 u u u检验)

        • 对双边检验 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 \rm H_0:\mu=\mu_0,H_1:\mu\neq\mu_0 H0:μ=μ0,H1:μ=μ0

          H 0 \rm H_0 H0 U = X ‾ − μ 0 σ / n U=\frac{\overline X-\mu_0}{\sigma/\sqrt{n}} U=σ/n Xμ0

          拒绝域为 { ∣ U ∣ ⩾ u α 2 } \{|U|\geqslant u_{\frac\alpha2}\} {Uu2α}

        • 右边 H 0 : μ ⩽ μ 0 , H 1 : μ > μ 0 \rm H_0:\mu\leqslant\mu_0,H_1:\mu>\mu_0 H0:μμ0,H1:μ>μ0

          拒绝域为 { U ⩾ u α } \{U\geqslant u_{\alpha}\} {Uuα}

        • 左边 H 0 : μ ⩾ μ 0 , H 1 : μ < μ 0 \rm H_0:\mu\geqslant\mu_0,H_1:\mu<\mu_0 H0:μμ0,H1:μ<μ0

          拒绝域为 { U ⩽ − u α } \{U\leqslant -u_{\alpha}\} {Uuα}

      • σ 2 \sigma^2 σ2未知: t t t检验法

        • Z Z Z检验法的步骤大致相同,不同之处在于此时正态总体的方差 σ 2 \sigma^2 σ2未知,要用 σ 2 \sigma^2 σ2的无偏估计 S 2 S^2 S2代替,所以检验统计量服从的分布于 Z Z Z的不同,拒绝域的临界点也不一样
          t = X ‾ − μ S / n ∼ t ( n − 1 ) t=\frac{\overline X-\mu}{S/\sqrt{n}}\sim t(n-1) t=S/n Xμt(n1)

          • 对双边检验 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 \rm H_0:\mu=\mu_0,H_1:\mu\neq\mu_0 H0:μ=μ0,H1:μ=μ0

            拒绝域为 { ∣ t ∣ ⩾ t α 2 ( n − 1 ) } \{|t|\geqslant t_{\frac\alpha2}(n-1)\} {tt2α(n1)}

          • 右边 H 0 : μ ⩽ μ 0 , H 1 : μ > μ 0 \rm H_0:\mu\leqslant\mu_0,H_1:\mu>\mu_0 H0:μμ0,H1:μ>μ0

            拒绝域为 { t ⩾ t α ( n − 1 ) } \{t\geqslant t_{\alpha}(n-1)\} {ttα(n1)}

          • 右边 H 0 : μ ⩾ μ 0 , H 1 : μ < μ 0 \rm H_0:\mu\geqslant\mu_0,H_1:\mu<\mu_0 H0:μμ0,H1:μ<μ0

            拒绝域为 { t ⩽ − t α ( n − 1 ) } \{t\leqslant -t_{\alpha}(n-1)\} {ttα(n1)}

    • 单个正态总体方差 σ 2 \sigma^2 σ2的假设检验

      • μ \mu μ未知: χ 2 \chi^2 χ2检验法

        • 双边检验 H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 \rm H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2\neq\sigma_0^2 H0:σ2=σ02,H1:σ2=σ02

          H 0 \rm H_0 H0 χ 2 = ( n − 1 ) S 2 σ 0 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma^2_0}\sim\chi^2(n-1) χ2=σ02(n1)S2χ2(n1)

          拒绝域为 χ 2 ⩽ χ 1 − α 2 2 ( n − 1 ) 或 χ 2 ⩾ χ α 2 2 ( n − 1 ) \chi^2\leqslant\chi^2_{1-\frac\alpha2}(n-1)或\chi^2\geqslant \chi^2_{\frac\alpha2}(n-1) χ2χ12α2(n1)χ2χ2α2(n1)

        • 单边 H 0 : σ 2 ⩽ σ 0 2 , H 1 : σ 2 > σ 0 2 \rm H_0:\sigma^2\leqslant\sigma_0^2,H_1:\sigma^2>\sigma_0^2 H0:σ2σ02,H1:σ2>σ02

          拒绝域为 χ 2 ⩾ χ α 2 ( n − 1 ) \chi^2\geqslant \chi^2_{\alpha}(n-1) χ2χα2(n1)

        • 单边 H 0 : σ 2 ⩾ σ 0 2 , H 1 : σ 2 < σ 0 2 \rm H_0:\sigma^2\geqslant\sigma_0^2,H_1:\sigma^2<\sigma_0^2 H0:σ2σ02,H1:σ2<σ02

          拒绝域为 χ 2 ⩽ χ 1 − α 2 ( n − 1 ) \chi^2\leqslant \chi^2_{1-\alpha}(n-1) χ2χ1α2(n1)

    • 双正态总体均值差的假设检验

      • X 1 , . . . , X n 1 独立同分布 N ( μ 1 , σ 1 2 ) ;   Y 1 , . . . , Y n 2 独立同分布 N ( μ 2 , σ 2 2 ) X_1,...,X_{n_1}独立同分布N(\mu_1,\sigma^2_1);\ Y_1,...,Y_{n_2}独立同分布N(\mu_2,\sigma^2_2) X1,...,Xn1独立同分布N(μ1,σ12); Y1,...,Yn2独立同分布N(μ2,σ22)两样本独立,

      • σ 1 2 和 σ 2 2 \sigma_1^2和\sigma_2^2 σ12σ22已知,
        U = X ‾ − Y ‾ σ 1 2 n 1 + σ 2 2 n 2 U=\frac{\overline X-\overline Y}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} U=n1σ12+n2σ22 XY

    • σ 1 2 = σ 2 2 但未知 \sigma_1^2=\sigma_2^2但未知 σ12=σ22但未知

      H 0 \rm H_0 H0
      T = X ‾ − Y ‾ S w 1 / n 1 + 1 / n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\overline X-\overline Y}{S_w\sqrt{1/n_1+1/n_2}}\sim t(n_1+n_2-2) T=Sw1/n1+1/n2 XYt(n1+n22)

      • 双边检验 H 0 : μ 1 = μ 2 ; H 1 : μ 1 ≠ μ 2 \rm H_0:\mu_1=\mu_2;H_1:\mu_1\neq\mu_2 H0:μ1=μ2;H1:μ1=μ2

        拒绝域为 ∣ T ∣ ⩾ t α 2 ( n 1 + n 2 − 2 ) |T|\geqslant t_{\frac\alpha2}(n_1+n_2-2) Tt2α(n1+n22)

      • 单边 H 0 : μ 1 ⩽ μ 2 ; H 1 : μ 1 > μ 2 \rm H_0:\mu_1\leqslant \mu_2;H_1:\mu_1>\mu_2 H0:μ1μ2;H1:μ1>μ2

        拒绝域为 T ⩾ t α ( n 1 + n 2 − 2 ) T\geqslant t_{\alpha}(n_1+n_2-2) Ttα(n1+n22)

      • 单边 H 0 : μ 1 ⩾ μ 2 ; H 1 : μ 1 < μ 2 \rm H_0:\mu_1\geqslant \mu_2;H_1:\mu_1<\mu_2 H0:μ1μ2;H1:μ1<μ2

        拒绝域为 T ⩽ − t α ( n 1 + n 2 − 2 ) T\leqslant -t_{\alpha}(n_1+n_2-2) Ttα(n1+n22)

    • 双正态总体方差比的假设检验

      • μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2未知: F F F检验法
        F = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22S12F(n11,n21)

        • 双边检验 H 0 : σ 1 2 = σ 2 2 ,   H 1 : σ 1 2 ≠ σ 2 2 \rm H_0:\sigma_1^2=\sigma_2^2,\ H_1:\sigma_1^2\neq\sigma_2^2 H0:σ12=σ22, H1:σ12=σ22

          拒绝域 F ⩽ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) 或 F ⩾ F α 2 ( n 1 − 1 , n 2 − 1 ) F\leqslant F_{1-\frac\alpha2}(n_1-1,n_2-1)或F\geqslant F_{\frac\alpha2}(n_1-1,n_2-1) FF12α(n11,n21)FF2α(n11,n21)

        • 单边 H 0 : σ 1 ⩽ σ 2 ,   H 1 : σ 1 > σ 2 \rm H_0:\sigma_1\leqslant\sigma_2,\ H_1:\sigma_1>\sigma_2 H0:σ1σ2, H1:σ1>σ2

          拒绝域为 F ⩾ F α ( n 1 − 1 , n 2 − 1 ) F\geqslant F_{\alpha}(n_1-1,n_2-1) FFα(n11,n21)

        • 单边 H 0 : σ 1 ⩽ σ 2 ,   H 1 : σ 1 > σ 2 \rm H_0:\sigma_1\leqslant\sigma_2,\ H_1:\sigma_1>\sigma_2 H0:σ1σ2, H1:σ1>σ2

          拒绝域为 F ⩽ F 1 − α ( n 1 − 1 , n 2 − 1 ) F\leqslant F_{1-\alpha}(n_1-1,n_2-1) FF1α(n11,n21)

  • 相关阅读:
    【音视频】ffplay源码解析-PacketQueue队列
    Leetcode 1103. Distribute Candies to People
    机器学习笔记之线性分类——高斯判别分析(二)最优参数求解
    QPainter绘图
    leetcode刷题集:股票问题六讲【动态规划】(python代码)
    深入理解 pytest Fixture 方法及其应用
    卓岚APP远程采集正泰单相电子式电能表 ZLAN5144J的应用分享
    九、iOS原生应用(宿主App)与uni小程序间的通讯
    基于IOS音乐播放器在线歌词同步小程序系统(音乐小程序)
    waituntil and stopuntil说明
  • 原文地址:https://blog.csdn.net/weixin_45755332/article/details/127090551