BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)全称是:利用层次方法的平衡迭代规约和聚类。
Birch算法就是通过聚类特征(CF)形成一个聚类特征树,root 层的CF个数就是聚类个数。
BIRCH算法利用了一个树结构来帮助我们快速的聚类,这个树结构类似于平衡 B+ 树,一般将它称之为聚类特征树(Clustering Feature Tree,简称CF Tree)。这颗树的每一个节点是由若干个聚类特征(Clustering Feature,简称CF)组成。
BIRCH算法流程如下图所示:
整个算法实现共分为 4 个阶段:
参考链接
[1] 机器学习之经典算法(十六) Birch算法
[2] BIRCH聚类算法 2017.10
[3] 聚类算法的缺点_聚类算法(BIRCH)2021.1