• 均值漂移


    import numpy as np
    import pandas as pd
    import matplotlib.pylab as plt
    import matplotlib
    from sklearn import datasets
    matplotlib.rcParams['font.sans-serif'] = ['SimHei']
    data=pd.read_csv('010-data_multivar.csv',header=None)
    # print(data)

    #拆分数据
    dataset_X,dataset_y=data.iloc[:,:-1],data.iloc[:,-1]
    dataset_X=dataset_X.values
    dataset_y=dataset_y.values

    #估算带宽
    from sklearn.cluster import estimate_bandwidth,MeanShift
    # 数据集,quantile:分位数,n_samples:使用的样本大小
    bandwidth = estimate_bandwidth(dataset_X,quantile=0.05,n_samples=len(dataset_X))
    print('带宽:{}'.format(bandwidth))

    # 初始化聚类模型,带宽,网络化数据点(加速模型速度)
    meanshift = MeanShift(bandwidth=bandwidth,bin_seeding=True)
    meanshift.fit(dataset_X)

    print(meanshift.cluster_centers_) # 获取所有质心坐标
    print(meanshift.labels_) # 获取所有标签

    # 数据可视化
    def visual_meanshift_effect(meanshift,dataset):
    assert dataset.shape[1]==2,'only support dataset with 2 features'
    X=dataset[:,0]
    Y=dataset[:,1]
    X_min,X_max=np.min(X)-1,np.max(X)+1
    Y_min,Y_max=np.min(Y)-1,np.max(Y)+1
    X_values,Y_values=np.meshgrid(np.arange(X_min,X_max,0.01),
    np.arange(Y_min,Y_max,0.01))
    # 预测网格点的标记
    predict_labels=meanshift.predict(np.c_[X_values.ravel(),Y_values.ravel()])
    predict_labels=predict_labels.reshape(X_values.shape)
    plt.figure()
    plt.imshow(predict_labels,interpolation='nearest',
    extent=(X_values.min(),X_values.max(),
    Y_values.min(),Y_values.max()),
    cmap=plt.cm.Paired,
    aspect='auto',
    origin='lower')

    # 将数据集绘制到图表中
    plt.scatter(X,Y,marker='v',facecolors=None',edgecolors='k',s=30)

    # 将中心点绘制到图中
    centroids=meanshift.cluster_centers_
    plt.scatter(centroids[:,0],centroids[:,1],marker='o',
    s=100,linewidths=2,color='k',zorder=5,facecolors='b')
    plt.title('MeanShift effect graph')
    plt.xlim(X_min,X_max)
    plt.ylim(Y_min,Y_max)
    plt.xlabel('feature_0')
    plt.ylabel('feature_1')
    plt.show()

    visual_meanshift_effect(meanshift,dataset_X)

  • 相关阅读:
    如何在.netcore 上实现 Rbac 权限管理
    socket编程之TCP开发中的PEEK_MSG的使用与见解
    简述单例模式的一些优缺点及其评价
    排查线上内存泄漏,RingBufferLogEvent类内存占用过高,skyWalking内存占用过高
    Centos7安装docker(报错:container-selinux >= 2:2.74)
    JSP3.4
    Java SM2加密、解密、签名、验签
    获取properties文件中的
    五种生成唯一id方式的对比
    SpringBoot 改造成 https访问
  • 原文地址:https://www.cnblogs.com/txb1999/p/10738495.html
Copyright © 2020-2023  润新知