最近一直在实现一篇注释轨迹的文章,里面要用到kmeans聚类方法,先在网上随便找了一个kmeans程序进行聚类,结果发现时间太长,最后问了作者,作者采用的是vlfeat的系列程序,里面的kmens++程序速度较一般的来说比较快,网址如下:
http://www.vlfeat.org/index.html
实验中发现,如果聚类的特征都是从一个图片上得来,或者说都是一类相像的图片,每次的聚类结果是相同的,但是如果说聚类的图片来自两类图片的话,,每次聚类的结果差异就比较大了。这是因为kmeans本身存在的缺陷:初始化的点每次都是随机的,那么该如何解决这个问题呢?
问了几个师兄,然后再查了一些资料,并没有什么好的解决办法,只能在反复训练中找到最好的聚类结果,然后保存下来,后面都用这个结果,这样也不是没有道理,因为,这本来就是训练集需要的数据,在实际或者实验中,训练集本身就是提前知道的,在训练集不变的情况下就可以使用这种方法。
————————————————
版权声明:本文为CSDN博主「Tavia_YingWa」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/sinat_31407371/article/details/53837328