聚类数据生成函数–make_blobs()

2023年6月2日上午9:20 • 人工智能 • 阅读 110

n_samples（int/array-like,100）

生成的训练样本数量

如果是整数，这些点将被均分到所有种群中
如果是类数组，则其中的每个元素都表明一个种群中样本点的数量

n_features(int,2)

每个样本具有的特征数量

centers(int/ndarray of (n_samples, n_features),None)

生成样本中心点(种群)的数量或者固定的中心点的位置

如果n_samples是整数而且centers是None，将生成3个中心点
如果n_samples是一个类数组，那么centers必须是None或者一个长度等于n_samples的长度的数组

cluster_std(float/array-like,1.0)

生成样本点的标准差，表示生成样本点分布的松散程度

center_box(tuple,(-10.0,10.0))

如果centers是随机生成的，那么这个参数表示每个种群的边界框

shuffle(bool,True)

是否打乱样本点

random_state

决定随机数的生成（类似于种子）

return_centers(bool,False)

是否返回每个种群的中心点

返回值

数据类型形状描述xndarray(n_samples, n_features)生成的样本点yndarray(n_samples, )生成样本点的标签

使用实例

from sklearn.datasets import make_bolbs
import matplotlib.pyplot as plt
import numpy as np

centers=[[-1,1],[2,-2],[-2,-3]]
x,y = make_blobs(n_samples=50, centers=centers, cluster_std=0.60,random_state=0)

plt.figure()
c=np.array(centers)
plt.scatter(x[:,0],x[:,1],c=y)
plt.scatter(c[:,0],c[:,1],marker='^')
plt.show()

生成数据点如图所示，样本点被分为3个种群

Original: https://blog.csdn.net/m0_54510474/article/details/124340349
Author: 夺笋123
Title: 聚类数据生成函数–make_blobs()

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/560400/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

如何用Python让你的电脑说话

如何用Python让你的电脑说话你成为亿万花花公子的第一步如果你是像《钢铁侠》这样的电影的粉丝，你可能已经幻想过得到你自己的贾维斯。那么，在这篇文章中，我将告诉你如何开始制作你…

人工智能 2023年6月28日
0068
task4：掌握回归模型的评估及超参数调优

平均绝对误差 Mean Absolute Error(MAE) MAE用来描述预测值和真实值的差值。数值越小越好。假设𝑦𝑖是真实值，𝑓𝑖是相对应的预测值，则n个样本的MAE可由下式…

人工智能 2023年6月18日
00160
《Joint Learning of Named Entity Recognition and Entity Linking》论文笔记

Joint Learning of Named Entity Recognition and Entity Linking 2019 ACL Abstract 大多数 EL 方法忽…

人工智能 2023年6月10日
00112
基于C++的OpenCV项目实战——文档照片转换成扫描文件

基于C++的OpenCV项目实战——文档照片转换成扫描文件一、背景前段时间都是基于Python的OpecCV进行一些学习和实践，但小的知识点并没有应用到实际的项目中；并且基于P…

人工智能 2023年7月19日
0094
【学习day1】图像分类数据集+softmax回归

主要来源：李沐老师的pytorch 动手学习深度学习（鞠躬感谢）记录每日所学，欢迎讨论目录一. 图像分类数据集 * 1. 读取数据集 2. 读取小批量 3. 整合所有组件二….

人工智能 2023年7月1日
00106
Paddle安装是遇到 Error: Can not import avx core while this file exists:

Error: Can not import avx core while this file exists: D:\Python\lib\site-packages\paddle\…

人工智能 2023年6月16日
00102
python-类

面向对象在编程语言中，我们将变量看成数据，它用来存储多种形式的值；我们将函数看成操作，它用来对数据进行某些处理。所有的代码都由数据和操作构成，程序运行的本质就是对数据进行各种操作…

人工智能 2023年7月4日
0096
HDR多帧曝光融合Python代码实现

HDR算法Python实现：Github。先看结果：使用三脚架用自己手机分别设置-3、0、1 EV拍摄的输入图像：输出结果（左：0ev，右：HDR结果）： main.py: fro…

人工智能 2023年6月20日
0087
MySQL高级SQL语句

目录一、常用查询 1、按关键字排序 1.1 前期准备 1.2 升序、降序列出数据 1.3 找出其中南京的数据并以分数降序列出 1.4 查询学生信息先按兴趣id降序排列，相同分数的…

人工智能 2023年7月31日
0051
人工智能之图像识别

关于图像识别图像识别是人工智能的一个重要领域，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用。在计算机视觉识别…

人工智能 2023年6月18日
00103
数字信号与模拟信号的转化

连续信号：自变量t是连续的，但是s是不是连续的无所谓（比如像分段函数那样的信号），这样的信号都叫连续信号。离散信号：它是在连续信号上采样得到的信号。离散信号是一个序列，即其自变量…

人工智能 2023年5月25日
00106
BERT模型从训练到部署入坑记录（写给初学者）

本文主要参考：可西哥，《从BERT模型从训练到部署》，感谢作者详细的介绍，的确是从如何训练模型，模型压缩，模型服务部署，访问。如果你按照步骤操作，没有任何错误，并且最后，在你的浏…

人工智能 2023年5月23日
00107
详细讲解如何在win10系统上安装多个版本的CUDA

文章目录 * – 前言 – 电脑环境确认 – 安装新CUDA环境 – 测试新CUDA环境 – 总结 ; 前言当我们在部…

人工智能 2023年7月21日
00200
pandas行和列的获取

DataFrame的行和列：df[‘行’, ‘列’] DataFrame行和列的获取分三个维度行和列选取：df[]，一次只能选取行…

人工智能 2023年6月11日
00120
3. 梯度提升决策树（GBDT）详解

一、提升树以决策树为基函数的提升方法称为提升树。其中，分类问题采用二叉分类树，回归问题采用二叉回归树。sklearn中的提升树采用的是CART树。模型可以表示为决策树的加法模型：…

人工智能 2023年6月30日
0095
AI 作画《NBA球星动漫头像》| 用stable diffusion生成

扩散模型原理扩散模型是一种概率模型，通过逐步去噪一个正态分布变量来学习数据分布p(x)，对应于学习长度为t的固定马尔可夫链的反向过程。模型可以通过训练去噪自编码器来实现（T = …

人工智能 2023年7月30日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31