实际场景中,也需要研究两个变量的关系.检验也可能出现两个以上的总体.
假设检验中,若需检验
H
0
:
μ
1
=
μ
2
,
H
1
:
μ
1
≠
μ
2
H_0:μ_1=μ_2,H_1:μ_1 \not=μ_2
H0:μ1=μ2,H1:μ1=μ2,则可用t检验(
σ
1
2
=
σ
2
2
=
σ
2
\sigma_1^2=\sigma_2^2=\sigma^2
σ12=σ22=σ2未知),但如果有两个以上的总体需要检验呢?
H
0
:
μ
1
=
μ
2
=
L
=
μ
s
,
H
1
:
μ
1
,
μ
2
,
L
,
μ
s
不全相等
H_0:μ_1=μ_2=L=μ_s,H_1:μ_1,μ_2,L,μ_s不全相等
H0:μ1=μ2=L=μs,H1:μ1,μ2,L,μs不全相等
这是普遍存在的问题,影响一事物的因素往往很多的,如农业生产中,影响水稻产量的因素可能有:种子、肥料、气象、耕作等;同一种因素下也会有不同的水平状态. 有些因素影响较大,而有些转小,方差分析可以找不那些较显著影响产量的因素.

单因素方差分析的数据模型如下


为了导出检验统计量,我们使用平方和的分解

X
ˉ
是数据的总平均
\bar{X}是数据的总平均
Xˉ是数据的总平均.
S
T
为总偏差
S_T为总偏差
ST为总偏差,反应全部试验数据的差异.同理,以水平
A
j
A_j
Aj得

由定理可知均方为卡方统计量:

证明过程如下



得出检验表格

若给定一个显著水平α=0.05,求出F值,查得P-value(以前没有统计软件的时候,大家是查表来找到显著性水平0.05时对应的F临界值)
与单因素试验的方差分析差不多,同理得检验表格


回归分析是处理自变量与因变量之间的关系的一种统计方法和技术。而变量间的关系一般有两种:
回归分析就是研究变量间相关关系的一种统计方法。

可以发现,上式由两部分组成:

我们称
y
^
=
a
^
+
b
^
x
\hat{y}=\hat{a}+\hat{b}x
y^=a^+b^x为随机变量
Y
Y
Y 对
X
X
X的回归函数。

Q
Q
Q称为残差平方和,再对Q进一步转换

又因为
S
Y
Y
,
S
x
Y
已知
S_{YY},S_{xY}已知
SYY,SxY已知


《数理统计9.1-方差分析(ANOVA)概念与原理》
《我对方差分析原理的通俗理解,请指正》
《概率论与数理统计知识点提炼(第九章:方差分析及回归分析)》