无监督学习 — — 聚类方法分类

2023年7月1日下午8:03 • 人工智能 • 阅读 90

无监督学习 — — 聚类方法分类

*
–
+
* 0. 聚类
* 1. K均值聚类
*
– （1）. K均值聚类存在问题：
– （2）. K均值聚类实现代码：
* 2. 凝聚聚类
*
– （1）. 凝聚聚类实现代码：
* 3. DBSCAN 聚类
*
– （1）. DBSCAN 聚类实现代码：
* 👉原文链接

0. 聚类

clustering 是将数据集划分成组的任务，这些组叫做簇，其目标是划分数据，使得一个簇内的数据点非常相似，不通簇内的数据点又非常不同。

1. K均值聚类

K均值算法试图找到代表数据特定区域的簇中心，交替执行以下两个步骤:
1．将每个数据点分配给最近的簇中心，
2．每个簇中心设置为所分配的所有数据点的平均值，如果簇的分配不再发生变化，算法结束

; （1）. K均值聚类存在问题：

要求指定寻找簇的个数
k均值只能找到相对简单的形状
k均值仅考虑到最近簇中心的距离
算法的输出依赖于随机种子

（2）. K均值聚类实现代码：

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans

X,y = make_blobs(random_state=1)
plt.scatter(X[:,0],X[:,1])

Kmeans = KMeans(n_clusters=3)
Kmeans.fit(X)

y_pred = Kmeans.predict(X)
plt.scatter(X[:,0],X[:,1],c=y_pred)
plt.scatter(Kmeans.cluster_centers_[:,0],Kmeans.cluster_centers_[:,1],marker='^',linewidths=6,cmap=plt.cm.get_cmap('RdYlBu'))

plt.show()

2. 凝聚聚类

凝聚聚类:许多基于相同原则构建的聚类算法︰
1.首先每个点都是自己的簇，然后合并两个最相似的簇，直到满足某种停止准则为止，比如停止准则是簇的个数，因此相似的簇被合并，直到剩下指定个数的簇
2．用迭代的方式合并两个最近的簇，”最佳”的意思是簇的方差之和最小

; （1）. 凝聚聚类实现代码：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from sklearn.datasets import make_blobs
from sklearn.datasets import make_moons
from sklearn.cluster import KMeans

from sklearn.cluster import AgglomerativeClustering
X,y = make_blobs(random_state=1)
X_m,y_m = make_moons(n_samples=200,noise=0.05,random_state=1)

agg = AgglomerativeClustering(n_clusters=2)
ass = agg.fit_predict(X)
ass_m = agg.fit_predict(X_m)

plt.scatter(X_m[:,0],X_m[:,1],c = ass_m)

3. DBSCAN 聚类

DBSCAN原理:识别特征空间的”拥挤”区域的点
1.增大eps从左到右，更多的点会被包含在一个簇中，
2．增大min_samples,核心点会变得更少，更多的点被标记为噪声
2．用迭代的方式合并两个最近的簇，”最佳”的意思是簇的方差之和最小

; （1）. DBSCAN 聚类实现代码：

from sklearn.cluster import DBSCAN
from sklearn.cluster import AgglomerativeClustering

X,y = make_blobs(random_state=1)
X_m,y_m = make_moons(n_samples=200,noise=0.05,random_state=1)

dbscan = DBSCAN(eps=0.2)

clusters_m = dbscan.fit_predict(X_m)

plt.scatter(X_m[:,0],X_m[:,1],c = clusters_m)

👉原文链接

Original: https://blog.csdn.net/weixin_47160526/article/details/123613679
Author: 码猿小菜鸡
Title: 无监督学习 — — 聚类方法分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663971/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

JSP+Servlet+MySql超市管理系统项目源码

一、开发背景软件名称：超市管理系统(servlet+jsp) 使用对象：学习或了解过 java 基础课程，开始接触 javaWeb 的学生和软件爱好者源码链接:超市管理系统:…

人工智能 2023年7月29日
0059
操作系统学习笔记11 | 生磁盘的使用与管理

这部分是设备驱动的最后一部分——磁盘管理，相较于上一篇的键盘和显示器要更复杂，但大致过程基本相同。磁盘管理共有4层抽象，我们将从此学习、掌握设备驱动的一般研究理念和设计方法。这部分…

人工智能 2023年6月4日
0079
基于python的opencv的学习

前言在了解基本的python语法后，我们终于可以开始进行一些项目的实践学习。这里用opencv进行第一个python项目的上手。这里我将会分享自己寒假对于opencv的学习 …

人工智能 2023年7月19日
0087
Python-OpenCV对图像的遍历操作示例代码

Python-OpenCV对图像像素的遍历操作示例如果您想了解OpenCV-C++是如何遍历图像像图的，那么可以参看下面这个页面：https://www.hhai.cc/thre…

人工智能 2023年7月18日
0049
【数值预测案例】(3) LSTM 时间序列电量预测，附Tensorflow完整代码

大家好，今天和各位分享一下如何使用循环神经网络LSTM完成时间序列预测，本文是针对单个特征的预测，下一篇是对多个特征的预测。文末有完整代码 1. 导入工具包这里使用GPU加速计…

人工智能 2023年5月26日
0063
【物体检测快速入门系列 | 01 】基于Tensorflow2.x Object Detection API构建自定义物体检测器

这是机器未来的第1篇文章原文首发地址:https://blog.csdn.net/RobotFutures/article/details/124745966 CSDN话题挑战赛…

人工智能 2023年7月26日
0051
浅谈GCN

文章目录一：GCN与GNN的区别二：GCN原理 * – Step1: 求图模型的邻接矩阵和度矩阵 Step2：进行特征计算 + ① 邻接矩阵的改变 ② 度矩阵的改变…

人工智能 2023年6月22日
0082
霍尔电流传感器ACS712/CH701在电动方向盘电机驱动控制器的应用

随着车辆无人驾驶技术的蓬勃发展和先进控制系统的研制，人们对舵机整体工作性能的要求越来越高，促使了舵机向着体积质量不断减小、承载能力不断增强、控制性能不断提高的方向发展。舵机是车辆无…

人工智能 2023年6月10日
0091
数据库系统课程设计（高校成绩管理数据库系统的设计与实现）

目录 1、需求分析 1 1.1 数据需求描述 1 1.2 系统功能需求 3 1.3 其他性能需求 4 2、概念结构设计 4 2.1 局部E-R图 4 2.2 全局E-R图 5 2….

人工智能 2023年7月18日
0054
stata 亚组分析_CMA三天写论文！Meta分析实战

图谱小站郑重承诺，小站君所出视频均全网唯一，且网上找不到任何解决办法，觉得有用请将推文放入”在看”或”转发朋友圈”，帮助更多小伙伴 …

人工智能 2023年6月1日
00105
熊孩子说“你没看过奥特曼”，赶紧用Python学习一下，没想到

好的，以下是一个简单的 _Python_表白游戏示例： _python_ import _py_game, random # 初始化 _Py_game _py_game.init(…

人工智能 2023年7月15日
0091
PyTorch中的多GPU训练：DistributedDataParallel

在pytorch中的多GPU训练一般有2种DataParallel（DP）和DistributedDataParallel（DDP），DataParallel是最简单的的单机多卡…

人工智能 2023年7月21日
0074
基于Halcon的图像增强算子以及分类例程汇总

摘要图像增强就是指通过某种图像处理方法对退化的某些图像特征，如边缘、轮廓、对比度等进行处理，以改善图像的视觉效果，提高图像的清晰度，或是突出图像中的某些”有用&#82…

人工智能 2023年6月30日
0072
知识图谱笔记-(2)

图数据库：neo4j, arangodb,知识表示和表示学习是两个概念知识链接可以简单的认为是知识融合知识图谱的应用案例：推荐、搜索、问答、决策–基于图谱增强的可解释推…

人工智能 2023年6月1日
0069
系统辨识（学习笔记）

系统辨识一、基础知识 1.1 什么是系统辨识系统辨识是根据系统的输入输出时间函数来确定描述系统行为的数学模型。（百度百科）根据测得的输入输出，通过最小化误差标准函数，确定数学…

人工智能 2023年6月24日
0079
实验八项目案例-电商数据分析

任务描述本关任务：根据用户行为数据，编写 MapReduce 程序来统计出用户流失情况。相关知识本实训为中级难度的 MapReduce 程序设计练习，模拟真实场景中电商数据的…

人工智能 2023年7月15日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

无监督学习 — — 聚类方法分类

无监督学习 — — 聚类方法分类

0. 聚类

1. K均值聚类

; （1）. K均值聚类存在问题：

（2）. K均值聚类实现代码：

2. 凝聚聚类

; （1）. 凝聚聚类实现代码：

3. DBSCAN 聚类

; （1）. DBSCAN 聚类实现代码：

👉原文链接

大家都在看