1.make_bolbs() 函数
from sklearn.datasets.samples_generator import make_blobs import numpy as np import matplotlib.pyplot as plt
X , y = make_blobs(n_samples=1000 , n_features= 2 ,centers=[[-1,-1],[0,0],[1,1],[2,2]],cluster_std=[0.4,0.3,0.3,0.4],random_state=1)
其中:
- n_samples是待生成的样本的总数。
- n_features是每个样本的特征数。
- centers表示类别数。
- cluster_std表示每个类别的方差
plt.scatter(X[:,0],X[:,1],c = 'red') plt.show()
plt.scatter(X[:,0],X[:,1],c = y) # y是整数数组,代表每个点的颜色,长度为点个数 plt.show()