

因子分析的实例
例1

例2

因子分析模型
原理

- u是均值
- 公共因子可以看作是每个原始变量共同拥有的某些特征
- 特殊因子可以理解为只影响这个指标的因子
用矩阵形式表现
- A是系数矩阵,也称为因子载荷矩阵
- 一般m<=p,公共因子个数小于原始变量个数,要降维嘛
- 一个重要假定:A(p*m矩阵)的秩为m,用回归的说法就是保证了没有完全多重共线性。求出来的系数是有效的
- 要因子分析,就是要求A这个矩阵
假设
求A,要进行一些假设

- 公共因子均值为0
- 公共因子协方差矩阵是单位矩阵
- 特殊因子协方差矩阵是一个对角矩阵
- 公共因子与特殊因子不相关
- 类似回归里的变量不具有内生性,内生性会导致估计出来的结果失效,没有一致性
- 通过假设我们可以通过某种方法求出A
性质

x的均值就是u
协方差矩阵的定义:
x-u变为Af+e,展开,每一项与假设结合处理
最后原始变量的协方差矩阵分解,等于A乘A转置,加上特殊因子的协方差矩阵

- 正交矩阵就是自己乘自己转置为单位矩阵
- 人为构造A*,f*发现仍然成立,说明只要乘一个正交矩阵,因子载荷矩阵不唯一
- 所以可以找到一个我们便于解释的因子载荷矩阵。可以通过乘一个特殊的正交矩阵的方式,相当于进行了一次旋转。我们称为因子旋转

因子载荷矩阵的意义


-
a
i
j
a_{ij}
aij
- 原始变量
x
i
x_{i}
xi与公因子
f
i
f_{i}
fi的协方差
- x标准化后就是相关系数
- 默认经过了标准化
- 证明也不是很难

-
行元素平方和
h
i
2
h_{i}^2
hi2
- 原始变量
x
i
x_{i}
xi对公因子的依赖程度
-
h
i
2
h_{i}^2
hi2是公因子对
x
i
x_{i}
xi的影响,称为共性方差
-
σ
i
2
σ_{i}^2
σi2是特殊因子的方差,称为个性方差
-
由于标准化之后的
x
i
x_{i}
xi方差为1,所以
h
i
2
+
σ
i
2
h_{i}^2+σ_{i}^2
hi2+σi2为1
-
作用:如果
h
i
2
h_{i}^2
hi2为0.9,就可以说明公因子解释了90%,特殊因子解释了10%

- 列元素平方和
g
i
2
g_{i}^2
gi2
- 到时候SPSS会把这些都跑出来
- 这一块是写论文,跑出来的结果怎么解释的关键


- 主成分、最大似然估计、主轴因子法用的比较多
- 数学建模时可以都试一下,看一下哪个更方便自己解释,就选哪个
因子旋转方法
- 比赛时用正交旋转一般就够了
- 要使得新公共因子载荷系数绝对值尽可能接近0或1


因子分析

SPSS操作实例
具体的操作,比较实用

第一次运行
第一次运行因子分析的结果一般作为参考,首先我们要确定原始数据是否适合进行因子分析,即能否通过KMO检验和巴特利特球形检验。


- 其中KMO检验和巴特利特球形检验
- KMO检验直接根据SPSS给出的KMO值判断
- 巴特利特球形检验
- 原假设为变量间不存在相关性
- 如果P值<0.05,则拒绝原假设,说明可以做因子分析



- 这里的主成分方法,如果不对得到的结果进行因子旋转,提取出来的因子跟主成分分析得到的主成分是一样的
- 提取的因子数,可以先不确定,先进行一次分析再确定,所以先勾选上面的基于特征值
- 因子分析一般会运行两遍
- 因子旋转方法
- 因子得分方法
结果分析,能否通过检验,说明一下

确定因子数量

- 跟主成分分析相似
- 后面越平坦说明信息越少
- 这个红框框可以在ppt画
调整因子个数重新计算

对因子分析结果的介绍

SPSS会默认标准化。
比如100m这里说明,提取的两个公共因子对这个100m的变量贡献率为95%
正交旋转不会改变公因子方差

- 成分矩阵
- 成分矩阵就是没旋转的因子载荷矩阵
- 这里明显可以看出旋转后的更好解释

- 有时候旋转后的也不是很好解释,那我们可以改变提取方法和旋转方法等
- 让结果好解释
因子载荷散点图

因子得分


-
不能用于评价,不能说明得分越高就越好
-
降维后可以用于聚类和回归
要将那两个检验写上去,当检验通过,说明指标间相关性较强,说明因子分析有效