主成分分析
PCA 通过将数据正交变换为一组主成分来减少数据帧。第一个主成分解释了单个成分中数据的最大变化量,第二个主成分解释了第二大的变化量,依此类推。通过选择顶部ķ解释 80-90% 变化的主成分,其他成分可以被删除,因为它们对模型没有显着的好处。此过程保留了主成分中的一些潜在信息,有助于构建更好的模型。
PCA 程序将应用于该数据集上的连续变量。
suppressPackageStartupMessages(library(DAAG))
head(ais)
# standardise
minmax <- function(x