Kmeans

K-Mmeans算法使用贪心策略求得一个近似解，具体步骤如下：

[u_{1},u_{2}...u_{k} ]

[dist(x^{(i)},u_{i}) ]

，然后把样本点划入最近的簇中

[x^{(i)}in u^{_{nearest}} ]

[u_{i}: = frac{1}{left | c_{i} ight |} sum_{xin C_{i}}x ]

K-means算法得到的聚类结果严重依赖与初始簇中心的选择，如果初始簇中心选择不好，就会陷入局部最优解，避免这种情况的简单方法是重复多次运行K-means算法，然后取一个平均结果。

K-means算法初始中心点的选取，改进后的选取流程如下：

K-means++ 能显著的改善分类结果的最终误差。

尽管计算初始点时花费了额外的时间，但是在迭代过程中，k-mean 本身能快速收敛，因此算法实际上降低了计算时间。

网上有人使用真实和合成的数据集测试了他们的方法，速度通常提高了 2 倍，对于某些数据集，误差提高了近 1000 倍。

相关阅读:
TweenMax参数补充
jQuery.lazyload详解
js函数和jquery函数详解
数数苹果手机中的不科学
网页全栈工程师要点分析
瞄了一眼墙外的世界，只能给差评
脑洞大开的自然语言验证码
别再迷信 zepto 了
产品列表页分类筛选、排序的算法实现（PHP）
大学回顾和C与PHP之路

原文地址：https://www.cnblogs.com/heimazaifei/p/12976219.html