聚类算法就如这个名字一样,物以类聚,人以群分。
这个算法的过程是一个无监督学习的过程如k-means是一个通过先设置k值就是想要划分的类别个数然后通过随机初始点然后通过距离算法就行自动迭代使k个数据点达到数据中心。其优点是速度快,计算方便 本身就是一个距离迭代的过程。
其次比较经典就还有层次聚类,这种算法就是一种自上而下的算法,先每个数据点视为一个单一的族,然后通过族之间的距离进行合并。
总之,聚类算法为论是最先进的还是最早之前都逃不开是通过距离的算法。