原文地址: 【概率论与数理统计(研究生课程)】知识点总结8(假设检验)
小概率原理: 小概率事件在一次试验中几乎不会发生(实际推断原理)
小概率事件在一次试验中发生的概率记为 α \alpha α, α \alpha α为显著水平,检验水平
小概率事件在一次试验中居然发生,就可以以很大把握否定原假设。
注意:不否定 H 0 H_0 H0并不是肯定 H 0 H_0 H0一定对,而是说差异不够显著,没有达到足以否定 H 0 H_0 H0的程度
记事件
A
A
A为犯第一类错误
P
{
A
}
=
P
{
reject
H
0
∣
H
0
is true
}
=
α
P\{A\}=P\{\text{reject } H_0 | H_0\text{ is true}\}=\alpha
P{A}=P{reject H0∣H0 is true}=α
记事件
B
B
B为犯第二类错误
P
{
B
}
=
P
{
accept
H
0
∣
H
0
is false
}
=
β
β
=
∫
μ
0
−
U
α
2
σ
n
μ
0
+
U
α
2
σ
n
1
2
π
σ
n
e
−
(
x
ˉ
−
μ
1
)
2
2
σ
2
n
d
x
ˉ
=
Φ
(
μ
0
−
μ
1
σ
/
n
+
U
α
2
)
−
Φ
(
μ
0
−
μ
1
σ
/
n
−
U
α
2
)
P{B}=P{accept H0|H0 is false}=ββ=μ0+Uα2σ√n∫μ0−Uα2σ√n1√2πσ√ne−(ˉx−μ1)22σ2ndˉx=Φ(μ0−μ1σ/√n+Uα2)−Φ(μ0−μ1σ/√n−Uα2)
- 当样本容量固定式,一类错误概率减少导致另一类错误概率增加。 α \alpha α减少,区间长度 2 U α 2 σ n 2U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} 2U2αnσ变长,则 β \beta β变大。
- 要同时降低两类错误的概率,或在 α \alpha α不变时降低 β \beta β,需要增加样本容量。
- 显著性检验只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率
提出原假设和备择假设:
H
0
:
μ
=
μ
0
;
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0;\quad H_1:\mu \neq\mu_0
H0:μ=μ0;H1:μ=μ0
选取统计量
U
=
X
ˉ
−
μ
0
σ
/
n
∼
N
(
0
,
1
)
U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)
U=σ/nXˉ−μ0∼N(0,1)
写出拒绝域
∣
U
∣
=
∣
X
ˉ
−
μ
0
σ
/
n
∣
≥
Z
α
2
|U|=|\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}| \ge Z_{\frac{\alpha}{2}}
∣U∣=∣σ/nXˉ−μ0∣≥Z2α
确定 Z α 2 Z_{\frac{\alpha}{2}} Z2α
计算 ∣ U ∣ |U| ∣U∣
判断结果
∣
U
∣
≥
Z
α
2
reject
H
0
∣
U
∣
<
Z
α
2
accept
H
0
|U|≥Zα2reject H0|U|<Zα2accept H0
提出原假设和备择假设:
H
0
:
μ
≥
μ
0
;
H
1
:
μ
<
μ
0
H_0:\mu\ge\mu_0;\quad H_1:\mu <\mu_0
H0:μ≥μ0;H1:μ<μ0
选取统计量
U
=
X
ˉ
−
μ
0
σ
/
n
∼
N
(
0
,
1
)
U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)
U=σ/nXˉ−μ0∼N(0,1)
写出拒绝域
U
=
X
ˉ
−
μ
0
σ
/
n
≤
−
Z
α
U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \le -Z_{\alpha}
U=σ/nXˉ−μ0≤−Zα
确定 Z α Z_{\alpha} Zα
计算 U U U
判断结果
U
≤
−
Z
α
reject
H
0
U
>
−
Z
α
accept
H
0
U≤−Zαreject H0U>−Zαaccept H0
提出原假设和备择假设:
H
0
:
μ
≤
μ
0
;
H
1
:
μ
>
μ
0
H_0:\mu\le\mu_0;\quad H_1:\mu >\mu_0
H0:μ≤μ0;H1:μ>μ0
选取统计量
U
=
X
ˉ
−
μ
0
σ
/
n
∼
N
(
0
,
1
)
U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)
U=σ/nXˉ−μ0∼N(0,1)
写出拒绝域
U
=
X
ˉ
−
μ
0
σ
/
n
≥
Z
α
U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \ge Z_{\alpha}
U=σ/nXˉ−μ0≥Zα
确定 Z α Z_{\alpha} Zα
计算 U U U
判断结果
U
≥
Z
α
reject
H
0
U
<
Z
α
accept
H
0
U≥Zαreject H0U<Zαaccept H0
注意:
无论是双边检验还是单边检验,原假设 H 0 H_0 H0中一定要包含等于。
左边检验和右边检验原假设箭头方向问题。可以这么理解:左边检验,检验的是下界,箭头就是 ≥ \ge ≥,右边检验检验的是上界,箭头就是 ≤ \le ≤。
单边检验和双边检验使用情况总结:
右边检验:是否提高、是否偏高、是否增加、是否超过,原假设就是没有提高,用小于等于…
左边检验:是否降低、是否偏低、是否减少、是否不足,原假设就是没有降低,用大于等于…
双边检验:是否正常、是否合格、有无差别、有无差异、有无变化、有无影响
总的来说,单边检验问题中有方向性,双边检验问题无方向性。
关于原假设的提法,我也是搞了很久,一直不明白,我们再回顾一下假设检验的逻辑:小概率事件在一次试验中居然发生了,那我们就有很大把握否定原假设,因此原假设必然是大概率的,你没有足够的证据就不能说明原假设是错的(类似于法律上的无罪推定),也就是所谓的 H 0 H_0 H0受保护。那什么样的假设是大概率的?或者说我们该如何提原假设?我认为应该把通常情况,或者说过去一直发生的情况,或者说某种标准,再或者原先就有的结论作为原假设,因为这些事件都是大概率的;把我们需要去证明的结论作为备择假设(这种主要用于前面所说的几种情况题目中都没给)。比如题目中可能会说,某标准为不超过多少,问是否符合标准,此时应假设是符合标准的,即 H 0 : μ ≤ μ 0 H_0:\mu\le \mu_0 H0:μ≤μ0。比如以往某机器精度为 μ 0 \mu_0 μ0,让检验现在机器是否正常工作,此时应假设正常工作,即 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0。再比如什么都不知道,题目问能否认为某某超过 μ 0 \mu_0 μ0,此时假设 H 1 : μ > μ 0 H_1:\mu > \mu_0 H1:μ>μ0。至于说足够的证据,那就是一次试验中小概率事件发生了,根据实际推断原理,小概率事件是几乎不可能在一次试验中发生的,那既然发生了,我们就可以认为 H 0 H_0 H0错了,也就拒绝 H 0 H_0 H0。
以下双边检验仅提供统计量和拒绝域以及单边检验的原假设和拒绝域:
选取统计量: T = X ˉ − μ S / n ∼ t ( n − 1 ) T=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1) T=S/nXˉ−μ∼t(n−1)
拒绝域: ∣ T ∣ ≥ t α 2 ( n − 1 ) |T|\ge t_{\frac{\alpha}{2}}(n-1) ∣T∣≥t2α(n−1)
right
:
H
0
:
μ
≤
μ
0
;
H
1
:
μ
>
μ
0
rejection region
:
X
ˉ
−
μ
S
/
n
≥
t
α
(
n
−
1
)
left
:
H
0
:
μ
≥
μ
0
;
H
1
:
μ
<
μ
0
rejection region
:
X
ˉ
−
μ
S
/
n
≤
−
t
α
(
n
−
1
)
right:H0:μ≤μ0;H1:μ>μ0rejection region:ˉX−μS/√n≥tα(n−1)left:H0:μ≥μ0;H1:μ<μ0rejection region:ˉX−μS/√n≤−tα(n−1)
选取统计量: χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) χ2=σ2(n−1)S2∼χ2(n−1)
拒绝域: χ 2 ≤ χ 1 − α 2 2 ( n − 1 ) \chi^2\le\chi^2_{1-\frac{\alpha}{2}}(n-1) χ2≤χ1−2α2(n−1)或 χ 2 ≥ χ α 2 2 ( n − 1 ) \chi^2\ge\chi^2_{\frac{\alpha}{2}}(n-1) χ2≥χ2α2(n−1) 两个临界值都需要确定
right
:
H
0
:
σ
2
≤
σ
0
2
;
H
1
:
σ
2
>
σ
0
2
rejection region
:
χ
2
≥
χ
α
2
(
n
−
1
)
left
:
H
0
:
σ
2
≥
σ
0
2
;
H
1
:
σ
2
<
σ
0
2
rejection region
:
χ
2
≤
χ
1
−
α
2
(
n
−
1
)
right:H0:σ2≤σ20;H1:σ2>σ20rejection region:χ2≥χ2α(n−1)left:H0:σ2≥σ20;H1:σ2<σ20rejection region:χ2≤χ21−α(n−1)
H 0 : μ 1 = μ 2 ; H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2;\quad H_1:\mu_1\neq\mu_2 H0:μ1=μ2;H1:μ1=μ2
方差 σ 2 \sigma^2 σ2已知
选取统计量: U = X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22Xˉ−Yˉ∼N(0,1)
拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
right
:
H
0
:
μ
1
≤
μ
2
;
H
1
:
μ
1
>
μ
2
rejection region
:
U
≥
U
α
left
:
H
0
:
μ
1
≥
μ
2
;
H
1
:
μ
1
<
μ
2
rejection region
:
U
≤
−
U
α
right:H0:μ1≤μ2;H1:μ1>μ2rejection region:U≥Uαleft:H0:μ1≥μ2;H1:μ1<μ2rejection region:U≤−Uα
方差 σ 2 \sigma^2 σ2未知
双边
选取统计量: T = X ˉ − Y ˉ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) , S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 T=\frac{\bar{X}-\bar{Y}}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2),\quad S_w=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} T=Swn11+n21Xˉ−Yˉ∼t(n1+n2−2),Sw=n1+n2−2(n1−1)S12+(n2−1)S22
拒绝域: ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) ∣T∣≥t2α(n1+n2−2)
单边
right
:
H
0
:
μ
1
≤
μ
2
;
H
1
:
μ
1
>
μ
2
rejection region
:
T
≥
t
α
(
n
1
+
n
2
−
2
)
left
:
H
0
:
μ
1
≥
μ
2
;
H
1
:
μ
1
<
μ
2
rejection region
:
T
≤
−
t
α
(
n
1
+
n
2
−
2
)
right:H0:μ1≤μ2;H1:μ1>μ2rejection region:T≥tα(n1+n2−2)left:H0:μ1≥μ2;H1:μ1<μ2rejection region:T≤−tα(n1+n2−2)
H 0 : μ 1 − μ 2 = δ ; H 1 : μ 1 − μ 2 ≠ δ H_0:\mu_1-\mu_2=\delta; \quad H_1:\mu_1-\mu_2\neq\delta H0:μ1−μ2=δ;H1:μ1−μ2=δ
如果是检验 μ 1 \mu_1 μ1和 μ 2 \mu_2 μ2是否相等,则 δ = 0 \delta=0 δ=0
选取统计量: T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 = X ˉ − Y ˉ − δ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\frac{\bar{X}-\bar{Y}-\delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) T=Swn11+n21Xˉ−Yˉ−(μ1−μ2)=Swn11+n21Xˉ−Yˉ−δ∼t(n1+n2−2)
拒绝域: ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) ∣T∣≥t2α(n1+n2−2)
right
:
H
0
:
μ
1
−
μ
2
≤
δ
;
H
1
:
μ
1
−
μ
2
>
δ
rejection region
:
T
≥
t
α
(
n
1
+
n
2
−
2
)
left
:
H
0
:
μ
1
−
μ
2
≥
δ
;
H
1
:
μ
1
−
μ
2
<
δ
rejection region
:
T
≤
−
t
α
(
n
1
+
n
2
−
2
)
right:H0:μ1−μ2≤δ;H1:μ1−μ2>δrejection region:T≥tα(n1+n2−2)left:H0:μ1−μ2≥δ;H1:μ1−μ2<δrejection region:T≤−tα(n1+n2−2)
H 0 : σ 1 2 = σ 2 2 ; H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2;\quad H_1:\sigma_1^2\neq\sigma_2^2 H0:σ12=σ22;H1:σ12=σ22
选取统计量: F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22/σ22S12/σ12=S22S12∼F(n1−1,n2−1)
拒绝域: F ≤ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) F\le F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) F≤F1−2α(n1−1,n2−1)或 F ≥ F α 2 ( n 1 − 1 , n 2 − 1 ) F\ge F_{\frac{\alpha}{2}}(n_1-1,n_2-1) F≥F2α(n1−1,n2−1)
μ \mu μ假设检验是 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)下提出的,当 X X X不能服从正态分布时,只需要 n n n足够大,对 μ \mu μ均可用 Z Z Z检验。
方差已知
选取统计量: Z = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/nXˉ−μ0∼N(0,1)【近似】
方差未知
选取统计量: Z = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) Z=S/nXˉ−μ0∼N(0,1)【近似】
方差已知
选取统计量: X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1σ12+n2σ22Xˉ−Yˉ∼N(0,1)【近似、大子样】
方差未知
选取统计量: X ˉ − Y ˉ S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) n1S12+n2S22Xˉ−Yˉ∼N(0,1)
若考虑 X ˉ 、 Y ˉ \bar{X}、\bar{Y} Xˉ、Yˉ, ∣ X ˉ − Y ˉ ∣ > U α 2 S 1 2 n 1 + S 2 2 n 2 |\bar{X}-\bar{Y}|>U_{\frac{\alpha}{2}}\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}} ∣Xˉ−Yˉ∣>U2αn1S12+n2S22
P { X = x } = p x ( 1 − p ) 1 − x P\{X=x\}=p^x(1-p)^{1-x} P{X=x}=px(1−p)1−x
H 0 : p = p 0 ; H 1 : p ≠ p 0 H_0:p=p_0;H_1:p\neq p_0 H0:p=p0;H1:p=p0
E ( X ˉ ) = p , D ( X ˉ ) = 1 n p ( 1 − p ) E(\bar{X})=p,D(\bar{X})=\frac{1}{n}p(1-p) E(Xˉ)=p,D(Xˉ)=n1p(1−p)
当 n n n很大时, U = X ˉ − p p ( 1 − p ) n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-p}{\sqrt{\frac{p(1-p)}{n}}}\sim N(0,1) U=np(1−p)Xˉ−p∼N(0,1)
拒绝域: ∣ U ∣ = ∣ X ˉ − p 0 ∣ p 0 ( 1 − p 0 ) / n ≥ U α 2 |U|=\frac{|\bar{X}-p_0|}{\sqrt{p_0(1-p_0)}/{\sqrt{n}}}\ge U_\frac{\alpha}{2} ∣U∣=p0(1−p0)/n∣Xˉ−p0∣≥U2α
H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;H_1:\mu\neq\mu_0 H0:μ=μ0;H1:μ=μ0
中心极限定理:当 n n n充分大时,
方差已知
选取统计量: U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) U=σ/nXˉ−μ0∼N(0,1)【近似】
方差未知
选取统计量: U = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) U=S/nXˉ−μ0∼N(0,1)【近似】
拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
方差已知
选取统计量: U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22Xˉ−Yˉ−(μ1−μ2)∼N(0,1)【近似】
方差未知
选取统计量: U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) U=n1S12+n2S22Xˉ−Yˉ−(μ1−μ2)∼N(0,1)【近似】
拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
H 0 : F ( x ) = F 0 ( x ) ; H 1 : F ( x ) ≠ F 0 ( x ) H_0:F(x)=F_0(x);\quad H_1:F(x)\neq F_0(x) H0:F(x)=F0(x);H1:F(x)=F0(x)
F(x)不含未知参数
选取统计量: χ 2 = ∑ i = 1 k ( f i − n p i ) 2 n p i ∼ χ 2 ( k − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-np_i)^2}{np_i}\sim \chi^2(k-1) χ2=i=1∑knpi(fi−npi)2∼χ2(k−1)【 H 0 H_0 H0为真, n n n充分大】
拒绝域: χ 2 ≥ χ α 2 ( k − 1 ) \chi^2\ge\chi^2_\alpha(k-1) χ2≥χα2(k−1)
F(x)含有未知参数
注意:
- 大样本, n ≥ 50 n\ge 50 n≥50
- 要求各组理论频数 n p i ≥ 5 np_i\ge5 npi≥5或 n p ^ i ≥ 5 n\hat{p}_i\ge 5 np^i≥5
- 一般数据分成7到14组
存在问题:
- 分组不同,拟合的结果不同
- 需要有足够的样本容量
- 对连续型变量的优度拟合, χ 2 \chi^2 χ2检验不是理想的方法
H 0 : X , Y H_0:X,Y H0:X,Y 独立; H 1 : X , Y \quad H_1:X,Y H1:X,Y 不独立
选取统计量: χ 2 = n ∑ i = 1 m ∑ j = 1 k ( n i j − n i ⋅ n ⋅ j n ) 2 n i ⋅ n ⋅ j = n ( ∑ i = 1 m ∑ j = 1 k n i j 2 n i ⋅ n ⋅ j − 1 ) ∼ χ 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2=n\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{(n_{ij}-\frac{n_{i\cdot}n_{\cdot j}}{n})^2}{n_{i\cdot}n_{\cdot j}}=n(\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{n_{ij}^2}{n_{i\cdot}n_{\cdot j}}-1)\sim \chi^2((m-1)(k-1)) χ2=ni=1∑mj=1∑kni⋅n⋅j(nij−nni⋅n⋅j)2=n(i=1∑mj=1∑kni⋅n⋅jnij2−1)∼χ2((m−1)(k−1))【近似】
拒绝域: χ 2 ≥ χ α 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2\ge \chi^2_\alpha((m-1)(k-1)) χ2≥χα2((m−1)(k−1))
同时,还能通过独立性判断相关性。