• make_blobs


    一、make_blobs简介

     scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。

    二、函数原型

    sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)
    

     其中

      n_samples是待生成的样本的总数。

      n_features是每个样本的特征数,即维度

      centers表示类别数。

      cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0]。

    三、实例

    from sklearn.datasets import make_blobs
    X, y = make_blobs(n_samples=150, n_features=2, centers=3, cluster_std=0.5, shuffle=True, random_state=0)
    
    import matplotlib.pyplot as plt
    plt.scatter(X[:, 0], X[:, 1], c='red', marker='o', s=50)
    plt.grid()
    plt.show()
    

     其中plt.scatter()中的s参数表示marker的大小

     

  • 相关阅读:
    真的要努力了
    实事求是
    要努力了
    新征程,新目标
    真的要放弃了吗
    集中力量 主攻文科
    May the force be with me.
    记录级排名
    Android开发过程中git、repo、adb、grep等指令的使用
    Ubuntu环境变量设置
  • 原文地址:https://www.cnblogs.com/always-fight/p/9348232.html
Copyright © 2020-2023  润新知