详解基于密度的聚类算法——DBSCAN

详解基于密度的聚类算法——DBSCAN

今天给大家介绍另外一种聚类算法,也是我们日常使用频率非常高的一种聚类方法——基于密度的聚类算法。

基于密度的聚类算法是 通过计算样本的紧密程度来实现对样本类别的划分,在样本空间中聚集密度大的就会划分到一个类别中,理论上能够找出任何形状的聚类

密度聚类并不需要事先设定聚类簇的数量,算法会根据数据的密度分布情况自行决定聚类簇的个数,同时,还能够有效识别明显的噪声点(离群点)。

DBSCAN是一种非常经典的基于密度的聚类算法, DBSCAN算法可以找到样本点的全部密集区域,并把这些密集区域当做一个一个的聚类簇,今天我们就来一起盘一盘这个算法。

在具体学习DBSCAN算法原理前,我们先来了解一些算法相关的基本概念:

一、DBSCAN算法相关基本概念

1、关于密度的核心思想

DBSCAN通过计算样本间的密度,找到样本的全部聚集区域,并把这些聚集区域作为最终的聚类簇结果。各别的离群点并不会对最终结果产生影响(如图中紫色点)。

详解基于密度的聚类算法——DBSCAN

2、算法的两个核心参数

(1)邻域半径eps

DBSCAN会以各数据点为圆心心&#x

Original: https://blog.csdn.net/zy_dreamer/article/details/125707539
Author: 白话机器学习
Title: 详解基于密度的聚类算法——DBSCAN

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/550970/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球