设 X X X 为总体, ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots ,X_n) (X1,X2,⋯,Xn) 为来自总体 X X X 的简单随机样本, θ \theta θ 为未知参数,设 θ ^ = φ ( X 1 , X 2 , ⋯ , X n ) \widehat{\theta}=\varphi(X_1,X_2,\cdots,X_n) θ =φ(X1,X2,⋯,Xn) 为参数 θ \theta θ 的一个点估计量,若 E ( θ ^ ) = θ E(\widehat{\theta})=\theta E(θ )=θ ,称 θ ^ \widehat{\theta} θ 为参数 θ \theta θ 的无偏估计量。
【例】 设总体
X
X
X 的密度函数为
f
(
x
)
=
{
2
x
/
θ
2
0
<
x
<
θ
0
e
l
s
e
f(x)=
(1)求参数 θ \theta θ 的矩估计量;(2)求参数 θ \theta θ 的最大似然估计量;(3)矩估计量是否为无偏估计。
解: (1)
E
(
X
)
=
∫
−
∞
∞
x
f
(
x
)
d
x
=
2
θ
/
3
E(X)=\int_{-\infty}^\infty xf(x)dx=2\theta/3
E(X)=∫−∞∞xf(x)dx=2θ/3 ,令
2
θ
/
3
=
X
‾
2\theta/3=\overline{X}
2θ/3=X ,则可得矩估计量
θ
^
=
3
X
‾
2
.
\widehat{\theta}=\frac{3\overline{X}}{2}.
θ
=23X. (2)构造似然函数
L
(
θ
)
=
f
(
x
1
)
f
(
x
2
)
⋯
f
(
x
n
)
=
2
n
θ
2
n
x
1
x
2
⋯
x
n
(
0
<
x
i
<
θ
,
i
=
1
,
2
,
⋯
,
n
)
.
d
ln
L
d
θ
=
−
2
n
θ
<
0.
L(\theta)=f(x_1)f(x_2)\cdots f(x_n)=\frac{2^n}{\theta^{2n}}x_1x_2\cdots x_n(0
(3) E ( θ ^ ) = 3 / 2 ⋅ E ( X ‾ ) = 3 / 2 ⋅ 2 θ / 3 = θ E(\widehat{\theta})=3/2\cdot E(\overline{X})=3/2\cdot2\theta/3=\theta E(θ )=3/2⋅E(X)=3/2⋅2θ/3=θ ,故是无偏估计量。
设
X
X
X 为总体,
(
X
1
,
X
2
,
⋯
,
X
n
)
(X_1,X_2,\cdots ,X_n)
(X1,X2,⋯,Xn) 为来自总体
X
X
X 的简单随机样本,
θ
\theta
θ 为未知参数,设
θ
^
1
,
θ
^
2
\widehat{\theta}_1,\widehat{\theta}_2
θ
1,θ
2 都是参数
θ
\theta
θ 的无偏估计量,若
D
(
θ
^
1
)
<
D
(
θ
^
2
)
D(\widehat{\theta}_1)
设 X X X 为总体, ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots ,X_n) (X1,X2,⋯,Xn) 为来自总体 X X X 的简单随机样本, θ \theta θ 为未知参数,设 θ ^ = φ ( X 1 , X 2 , ⋯ , X n ) \widehat{\theta}=\varphi(X_1,X_2,\cdots,X_n) θ =φ(X1,X2,⋯,Xn) 为参数 θ \theta θ 的一个估计量,若对任意 ϵ > 0 \epsilon>0 ϵ>0 ,有 lim n → ∞ P { ∣ θ ^ − θ ∣ < ϵ } = 1 \lim_{n\to\infty}P\{|\widehat{\theta}-\theta|<\epsilon\}=1 n→∞limP{∣θ −θ∣<ϵ}=1 称 θ ^ \widehat{\theta} θ 作为 θ \theta θ 的估计量具有一致性(或相合性)。
前面我们所学的两种方法为点估计法,即只能得到一个值,但实际上我们并非需要那么精确,况且点估计出来也不一定好,因此我们最好是估计一个区间范围。
设 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2) 为总体, ( X 1 , X 2 , ⋯ , X n ) (X_1,X_2,\cdots ,X_n) (X1,X2,⋯,Xn) 为来自总体 X X X 的简单随机样本, 0 < α < 1 0<\alpha<1 0<α<1 ,求参数的置信度为 1 − α 1-\alpha 1−α 的双侧置信区间。
1. 参数 σ 2 \sigma^2 σ2 已知
对 X ‾ \overline{X} X 标准化为标准正态分布,令其在 − z α 2 -z_{\alpha\over 2} −z2α 和 z α 2 z_{\alpha\over 2} z2α 内的概率为 1 − α 1-\alpha 1−α,可求出置信区间为 ( X ‾ − σ n z α 2 , X ‾ + σ n z α 2 ) \bigg(\overline{X}-\frac{\sigma}{\sqrt{n}}z_{\alpha\over2},\overline{X}+\frac{\sigma}{\sqrt{n}}z_{\alpha\over2}\bigg) (X−nσz2α,X+nσz2α) 2. 参数 σ 2 \sigma^2 σ2 未知
则利用 t t t 分布,即取 X ‾ − μ S n ∼ t ( n − 1 ) \frac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}}\sim t(n-1) nSX−μ∼t(n−1) 令其在 ( − t α 2 ( n − 1 ) , t α 2 ( n − 1 ) ) (-t_{\frac{\alpha}{2}}(n-1),t_{\frac{\alpha}{2}}(n-1)) (−t2α(n−1),t2α(n−1)) 的概率为 1 − α 1-\alpha 1−α ,可计算出置信区间为 ( X ‾ − S n t α 2 ( n − 1 ) , X ‾ + S n t α 2 ( n − 1 ) ) \bigg(\overline{X}-\frac{S}{\sqrt{n}}t_{\alpha\over2}(n-1),\overline{X}+\frac{S}{\sqrt{n}}t_{\alpha\over2}(n-1)\bigg) (X−nSt2α(n−1),X+nSt2α(n−1)) 此外还有对 σ 2 \sigma^2 σ2 的区间估计,汇总成下表:
其实单侧也就是双侧的区间取一端,如估计 μ \mu μ 且 σ 2 \sigma^2 σ2 已知,单侧置信区间为: ( X ‾ − σ n z α 2 , + ∞ ) , ( − ∞ , X ‾ + σ n z α 2 ) \bigg(\overline{X}-\frac{\sigma}{\sqrt{n}}z_{\alpha\over2},+\infty\bigg),\bigg(-\infty,\overline{X}+\frac{\sigma}{\sqrt{n}}z_{\alpha\over2}\bigg) (X−nσz2α,+∞),(−∞,X+nσz2α) 其余以此类推。
汇总成表:
其中
S
w
=
(
m
−
1
)
S
1
2
+
(
n
−
1
)
S
2
2
m
+
n
−
2
S_w=\frac{(m-1)S_1^2+(n-1)S_2^2}{m+n-2}
Sw=m+n−2(m−1)S12+(n−1)S22
看了下大纲,对区间估计的概念和一个、两个正态总体的置信区间公式作了理解要求,后期抽时间记忆记忆。