k均值算法非常简单且使用广泛,但是存在的缺陷有:
1. K值需要预先给定;
属于预先知识,很多情况下K值的估计非常困难。
2. K-Means算法对初始选取的聚类中心点是敏感的;
不同的随机种子点得到的聚类结果完全不同
3. K均值算法并不适合所有的数据类型;
不能处理非球形簇、不同尺寸和不同密度的簇。
4. 对离群点的数据进行聚类时,K均值也存在问题,这种情况下,离群点检测和删除有很大的帮助。
k均值算法非常简单且使用广泛,但是存在的缺陷有:
1. K值需要预先给定;
属于预先知识,很多情况下K值的估计非常困难。
2. K-Means算法对初始选取的聚类中心点是敏感的;
不同的随机种子点得到的聚类结果完全不同
3. K均值算法并不适合所有的数据类型;
不能处理非球形簇、不同尺寸和不同密度的簇。
4. 对离群点的数据进行聚类时,K均值也存在问题,这种情况下,离群点检测和删除有很大的帮助。