概率论中,随机现象的统计规律是通过随机变量的概率分布(分布律/分布函数)来全面描述
但是情况不总是已知的
确定某个分布类型下的分布的参数的问题,就是数理统计要研究的
数理统计使用概率论和数学的方法,研究**收集(观察/试验)**带有随机误差的数据的方法
在设定的统计模型之下,对收集到的数据进行统计分析,对所研究的问题做出统计推断
统计推断主要包括:
总体:
个体:
指标:
指标与随机变量:
从数学的方式描述总体和个体
每个个体被抽中的机会是均等的
抽取一个个体后不影响总体
样本 S \mathbb{\mathscr{S}} S的不含未知参数的函数 T = T ( S ) T=T(\mathscr{S}) T=T(S)称为统计量(是定义在样本上的函数)
因为统计量的作用在于推断未知参数,所以统计量函数不可以包括未知参数
作为随机变量的函数,统计量本身也是一个随机变量
如果 s 是 S 的样本值 , 则 : T ( s ) 为 T ( S ) 的观测值 如果s是\mathscr{S}的样本值,则:T(s)为T(\mathscr{S})的观测值 如果s是S的样本值,则:T(s)为T(S)的观测值
样本均值:
X ‾ = ∑ i = 1 n ( 1 n X i ) = 1 n ∑ i = 1 n X i \overline{X} =\sum\limits_{i=1}^{n}(\frac{1}{n}X_i) =\frac{1}{n}\sum\limits_{i=1}^{n}X_i X=i=1∑n(n1Xi)=n1i=1∑nXi
样本方差: S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2 S2=n−11i=1∑n(Xi−X)2
样本k阶原点矩
样本k阶中心矩
则:
推导:
X i 与总体 X 独立同分布 , 则有 : E ( X i ) = E ( X ) = μ D ( X i ) = D ( X ) = σ 2 D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) 记 T = ∑ i = 1 n X i ; 则 X ‾ = 1 n T ∑ i = 1 n X i = n X ‾ E ( X ‾ ) = E ( ∑ i = 1 n ( 1 n X i ) ) = 1 n ∑ i = 1 n E ( X i ) = 1 n n μ = μ D ( X ‾ ) = D ( ∑ i = 1 n ( 1 n X i ) ) = 1 n 2 ∑ i = 1 n D ( X i ) = 1 n 2 n σ 2 = 1 n σ 2 X_i与总体X独立同分布,则有: \\E(X_i)=E(X)=\mu \\D(X_i)=D(X)=\sigma^2 \\D(\sum\limits_{i=1}^{n}X_i)=\sum\limits_{i=1}^{n}D(X_i) \\记T=\sum\limits_{i=1}^{n}X_i;则\overline{X}=\frac{1}{n}T \\ \sum\limits_{i=1}^{n}X_i=n\overline{X} \\\\ E(\overline{X}) =E(\sum\limits_{i=1}^{n}(\frac{1}{n}X_i)) =\frac{1}{n}\sum\limits_{i=1}^{n}E(X_i) =\frac{1}{n}n\mu=\mu \\ D(\overline{X}) =D(\sum\limits_{i=1}^{n}(\frac{1}{n}X_i)) =\frac{1}{n^2}\sum\limits_{i=1}^{n}D(X_i) =\frac{1}{n^2}n\sigma^2=\frac{1}{n}\sigma^2 Xi与总体X独立同分布,则有:E(Xi)=E(X)=μD(Xi)=D(X)=σ2D(i=1∑nXi)=i=1∑nD(Xi)记T=i=1∑nXi;则X=n1Ti=1∑nXi=nXE(X)=E(i=1∑n(n1Xi))=n1i=1∑nE(Xi)=n1nμ=μD(X)=D(i=1∑n(n1Xi))=n21i=1∑nD(Xi)=n21nσ2=n1σ2
现在有 : E ( X i ) = E ( X ) = E ( X ‾ ) = μ D ( X i ) = D ( X ) = n D ( X ‾ ) = σ 2 ; D ( X ‾ ) = 1 n D ( X ) = 1 n σ 2 由于 X i , X 同分布 E ( X i 2 ) = E ( X 2 ) D ( X i 2 ) = D ( X 2 ) D ( X ) = E ( X 2 ) − E 2 ( X ) = σ 2 D ( X ‾ ) = E ( X ‾ 2 ) − E 2 ( X ‾ ) = 1 n σ 2 E ( X ‾ 2 ) = 1 n σ 2 + μ 2 E ( X i 2 ) = E ( X 2 ) = D ( X ) + E 2 ( X ) = σ 2 + μ 2 现在有: \\E(X_i)=E(X)=E(\overline{X})=\mu \\D(X_i)=D(X)=nD(\overline{X})=\sigma^2; \\D(\overline{X})=\frac{1}{n}D(X)=\frac{1}{n}\sigma^2 \\\\由于X_i,X同分布 \\E(X_i^2)=E(X^2) \\D(X_i^2)=D(X^2) \\D(X)=E(X^2)-E^2(X)=\sigma^2 \\D(\overline{X})=E(\overline{X}^2)-E^2(\overline{X})=\frac{1}{n}\sigma^2 \\E(\overline{X}^2)=\frac{1}{n}\sigma^2+\mu^2 \\E(X_i^2)=E(X^2)=D(X)+E^2(X)=\sigma^2+\mu^2 现在有:E(Xi)=E(X)=E(X)=μD(Xi)=D(X)=nD(X)=σ2;D(X)=n1D(X)=n1σ2由于Xi,X同分布E(Xi2)=E(X2)D(Xi2)=D(X2)D(X)=E(X2)−E2(X)=σ2D(X)=E(X2)−E2(X)=n1σ2E(X2)=n1σ2+μ2E(Xi2)=E(X2)=D(X)+E2(X)=σ2+μ2
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 E ( S 2 ) = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 E ( ∑ i = 1 n ( X i 2 − 2 X i X ‾ + X ‾ 2 ) ) = 1 n − 1 E ( ( ∑ i = 1 n X i 2 ) − ( 2 X ‾ ∑ i = 1 n X i ) + ( ∑ i = 1 n X ‾ 2 ) ) = 1 n − 1 E ( ( ∑ i = 1 n X i 2 ) − ( 2 n X ‾ 2 ) + ( n X ‾ 2 ) ) = 1 n − 1 E ( ( ∑ i = 1 n X i 2 ) − ( n X ‾ 2 ) ) = 1 n − 1 ( ( ∑ i = 1 n E ( X i 2 ) ) − ( n E ( X ‾ 2 ) ) ) = 1 n − 1 ( n ( μ 2 + σ 2 ) − ( n ( 1 n σ 2 + μ 2 ) ) = 1 n − 1 ( n ( σ 2 ) − ( σ 2 ) ) = n − 1 n − 1 σ 2 = σ 2 S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2 \\ E(S^2)=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2 \\=\frac{1}{n-1} E(\sum\limits_{i=1}^{n}(X_i^2-2X_i\overline{X}+\overline{X}^2)) \\=\frac{1}{n-1} E((\sum\limits_{i=1}^{n}X_i^2) -(2\overline{X}\sum\limits_{i=1}^{n}X_i) +(\sum\limits_{i=1}^{n}\overline{X}^2)) \\=\frac{1}{n-1} E((\sum\limits_{i=1}^{n}X_i^2) -(2n\overline{X}^2) +(n\overline{X}^2)) \\=\frac{1}{n-1} E((\sum\limits_{i=1}^{n}X_i^2) -(n\overline{X}^2)) \\=\frac{1}{n-1} ((\sum\limits_{i=1}^{n}E(X_i^2)) -(nE(\overline{X}^2))) \\=\frac{1}{n-1} (n(\mu^2+\sigma^2) -(n(\frac{1}{n}\sigma^2+\mu^2)) \\=\frac{1}{n-1} (n(\sigma^2)-( \sigma^2)) =\frac{n-1}{n-1}\sigma^2 =\sigma^2 S2=n−11i=1∑n(Xi−X)2E(S2)=n−11i=1∑n(Xi−X)2=n−11E(i=1∑n(Xi2−2XiX+X2))=n−11E((i=1∑nXi2)−(2Xi=1∑nXi)+(i=1∑nX2))=n−11E((i=1∑nXi2)−(2nX2)+(nX2))=n−11E((i=1∑nXi2)−(nX2))=n−11((i=1∑nE(Xi2))−(nE(X2)))=n−11(n(μ2+σ2)−(n(n1σ2+μ2))=n−11(n(σ2)−(σ2))=n−1n−1σ2=σ2
由独立同分布和Khinchin LLN可以得到:
设总体 X 的 k 阶原点矩 E ( X k ) = μ k ; 当 n → ∞ 记 : X k ‾ = 1 n ∑ i = 1 n X i k 1 n ∑ i = 1 n X i k → P μ k 或 : X ‾ → P μ k ( n → ∞ ) 矩的阶数 k = 1 , 2 , ⋯ 设总体X的k阶原点矩E(X^k)=\mu_k; \\当n\to\infin \\ 记:\overline{X^k}=\frac{1}{n}\sum\limits_{i=1}^{n}X_i^k \\ \frac{1}{n}\sum\limits_{i=1}^{n}X_i^k\xrightarrow{P}\mu_k \\或:\overline{X}\xrightarrow{P}\mu_k\quad(n\to{\infin}) \\矩的阶数k=1,2,\cdots 设总体X的k阶原点矩E(Xk)=μk;当n→∞记:Xk=n1i=1∑nXikn1i=1∑nXikPμk或:XPμk(n→∞)矩的阶数k=1,2,⋯
设 S = X 1 , X 2 , ⋯ , X 2 是来自总体 X 的样本 , 如果 : X ( k ) , k = 1 , ⋯ , n 对于任意一组样本观察值 s = ( x 1 , ⋯ , x n ) , 对序列 s 的各个值进行升序排列 , 得到 s s o r t e d = ( x i 1 , ⋯ , x i n ) 简写为 : s s o r t e d = ( x ( 1 ) , ⋯ , x ( n ) ) ; 注意 X ( p ) 与 X p 是截然不同的含义 尽管它们在取值上可能相等 , 但是前者是有上下文顺序和 x k 是区别的 x ( 1 ) 是最小的值 , x ( n ) 就是最大值 , 对于 x 1 , 或者 x n , 我们只知道他们分别是 X 1 , X n 的观测值 x k 是 X k 的观测值 , x ( k ) 是对排序后的第 k 个位置的值的称呼 其中 , 第 k 个值 x i k 称为 X k 设\mathscr{S}=X_1,X_2,\cdots,X_2是来自总体X的样本,如果: \\X_{(k)},k=1,\cdots,n \\对于任意一组样本观察值s=(x_1,\cdots,x_n), \\对序列s的各个值进行升序排列,得到s_{sorted}=(x_{i_1},\cdots,x_{i_n}) \\简写为:s_{sorted}=(x_{(1)},\cdots,x_{(n)}); \\注意X_{(p)}与X_{p}是截然不同的含义 \\尽管它们在取值上可能相等,但是前者是有上下文顺序和x_k是区别的 \\x_{(1)}是最小的值,x_{(n)}就是最大值,对于x_1,或者x_n, \\我们只知道他们分别是X_1,X_n的观测值 \\x_k是X_k的观测值,x_{(k)}是对排序后的第k个位置的值的称呼 \\其中,第k个值x_{i_k}称为X_{k} 设S=X1,X2,⋯,X2是来自总体X的样本,如果:X(k),k=1,⋯,n对于任意一组样本观察值s=(x1,⋯,xn),对序列s的各个值进行升序排列,得到ssorted=(xi1,⋯,xin)简写为:ssorted=(x(1),⋯,x(n));注意X(p)与Xp是截然不同的含义尽管它们在取值上可能相等,但是前者是有上下文顺序和xk是区别的x(1)是最小的值,x(n)就是最大值,对于x1,或者xn,我们只知道他们分别是X1,Xn的观测值xk是Xk的观测值,x(k)是对排序后的第k个位置的值的称呼其中,第k个值xik称为Xk
X ( 1 ) ⩽ X ( 2 ) ⩽ ⋯ ⩽ X ( 1 ) X_{(1)}\leqslant{X_{(2)}}\leqslant{\cdots}\leqslant{X_{(1)}} X(1)⩽X(2)⩽⋯⩽X(1)
设总体X的分布函数为F(x)
根据最大最小分布的性质(结论)
得最大/小顺序统计量的分布函数