聚类数据生成函数–make_blobs()

目录

sklearn.datasets.make_blobs(n_samples=100, n_features=2, *, centers=None, cluster_std=1.0, center_box=(- 10.0, 10.0), shuffle=True, random_state=None, return_centers=False)

生成具有各向异性的高斯分布散点用于 聚类

参数

n_samples(int/array-like,100)

生成的训练样本数量

如果是整数,这些点将被均分到所有种群中
如果是类数组,则其中的每个元素都表明一个种群中样本点的数量

n_features(int,2)

每个样本具有的特征数量

centers(int/ndarray of (n_samples, n_features),None)

生成样本中心点(种群)的数量或者固定的中心点的位置

如果n_samples是整数而且centers是None,将生成3个中心点
如果n_samples是一个类数组,那么centers必须是None或者一个长度等于n_samples的长度的数组

cluster_std(float/array-like,1.0)

生成样本点的标准差,表示生成样本点分布的松散程度

center_box(tuple,(-10.0,10.0))

如果centers是随机生成的,那么这个参数表示每个种群的边界框

shuffle(bool,True)

是否打乱样本点

random_state

决定随机数的生成(类似于种子)

return_centers(bool,False)

是否返回每个种群的中心点

返回值

数据类型形状描述xndarray(n_samples, n_features)生成的样本点yndarray(n_samples, )生成样本点的标签

使用实例

from sklearn.datasets import make_bolbs
import matplotlib.pyplot as plt
import numpy as np

centers=[[-1,1],[2,-2],[-2,-3]]
x,y = make_blobs(n_samples=50, centers=centers, cluster_std=0.60,random_state=0)

plt.figure()
c=np.array(centers)
plt.scatter(x[:,0],x[:,1],c=y)
plt.scatter(c[:,0],c[:,1],marker='^')
plt.show()

生成数据点如图所示,样本点被分为3个种群

聚类数据生成函数--make_blobs()

Original: https://blog.csdn.net/m0_54510474/article/details/124340349
Author: 夺笋123
Title: 聚类数据生成函数–make_blobs()

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/560400/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球