主成分分析(或称主分量分析,principal component analysis
)由皮尔逊(Pearson
,1901)首先引入,后来被霍特林(Hotelling
,1933)发展。
主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。
将数据标准化(必需,不同量纲和大小的数据影响结果)
求样本的相关系数矩阵R
求R
的特征值以及特征向量
按主成分累计贡献率超过80%
来确定主成分的个数K,并写出