• 聚类模型:K-Means


    K-Means算法

    • 数据挖掘十大经典算法之一

    • 算法接收参数k;然后将样本点划分为k个聚类;同一聚类中的样本相似度较高;不同聚类中的样本相似度较小

    算法思想:

    以空间中k个样本点为中心进行聚类,对最靠近它们的样本点归类。通过迭 代的方法,逐步更新各聚类中心,直至达到最好的聚类效果

    算法描述:

    1. 选择k个聚类的初始中心
    2. 在第n次迭代中,对任意一个样本点,求其到k个聚类中心的距离,将该 样本点归类到距离最小的中心所在的聚类
    3. 利用均值等方法更新各类的中心值
    4. 对所有的k个聚类中心,如果利用2,3步的迭代更新后,达到稳定,则迭代 结束。

    优缺点:

    • 优点:速度快,简单

    • 缺点:最终结果和初始点的选择相关,容易陷入局部最优,需要给定k值

  • 相关阅读:
    1026 Table Tennis (30)
    1029 Median
    1025 PAT Ranking (25)
    1017 Queueing at Bank (25)
    1014 Waiting in Line (30)
    1057 Stack (30)
    1010 Radix (25)
    1008 Elevator (20)
    字母大小写转换
    Nmap的基础知识
  • 原文地址:https://www.cnblogs.com/loaderman/p/11967284.html
Copyright © 2020-2023  润新知