聚类方法用于识别从营销,生物医学和地理空间等领域收集的多变量数据集中的相似对象。我们围绕聚类技术进行一些咨询,帮助客户解决独特的业务问题。它们是不同类型的聚类方法,包括:
KMEANS均值聚类和层次聚类:R语言分析生活幸福质量系数可视化实例
,时长06:05
- # 读取和准备数据
-
- my_data <- USArrests %>%
- na.omit() %>% # 删除缺失值
- scale() # 标准化变量
-
- # 查看前面3行
- head(my_data, n = 3)
- ## Murder Assault UrbanPop Rape
- ## Alabama 1.2426 0.783 -0.521 -0.00342
- ## Alaska 0.5079 1.107 -1.212 2.48420
- ## Arizona 0.0716 1.479 0.999 1.04288
get_dist()
:用于计算数据矩阵的行之间的距离矩阵。与标准dist()
功能相比,它支持基于相关的距离测量,包括“皮尔逊”,“肯德尔”和“斯皮尔曼”方法。fviz_dist()
:用于可视化距离矩阵- res.dist <- get_dist(U
- gradient = list(low = "#00AFBB", mid = "white", high = "#FC4E07"))