如果我们将数据进行可视化的方式进行展示,我们会直观的看到,可以使用三个簇来聚类,但是k均值经常会用于下面的这样的一些数据,我们很难看出应该分为几个簇。
我们并不能直观的看到这些数据属于几个簇。那么此时我们应该根据实际问题来确定,比如想要确定衣服的大小,假如我们要设计三种不同的衣服大小,小号,中号,大号,那么什么身高体重的应该穿小号,什么身高体重的应该穿中号,什么身高体重的应该穿大号?那么我们就设置k=3,通过运行聚类算法我们就可以得到
可以看出将数据聚成了三簇分别表示小号、中号、大号。我们现在就知道了什么身高体重的人穿小号、中号和大号,我们就能针对这些人来设计小号、中号和大号了,我们就能区别的对待这三类不同的顾客了,这就是聚类算法的实际应用。
聚类算法在实际问题中的应用